苹果ChatGPT挑战GPT-4，腾讯Sora3000星，AI领域新突破

7 4 月 2024

苹果ChatGPT挑战GPT-4，腾讯Sora3000星，AI领域新突破

新一代人工智能应用不断涌现，拓宽我们的想象力边界

随着人工智能技术的不断发展，各类创新应用层出不穷。钛媒体AGI特别为您带来了免费的AI“神器”系列第十一弹，本次共推荐五款创意十足的AI应用，它们将为我们展示AI的无限可能。

一、ReALM——让Siri更聪明

ReALM（Real-time Analysis of Live Media）是苹果公司研究团队开发的一款设备端AI模型。这款模型的参数量达到了惊人的8亿，部分性能甚至超过了GPT-4，使其具备理解前后文关系的能力，从而提高反应效率。ReALM不仅适用于实际产品，如ChatGPT，而且可以与各大科技巨头如Google、微软、OpenAI和亚马逊展开竞争。目前尚无法确定苹果是否会将其应用于iPhone、iPad和Mac等设备，但考虑到苹果已多次暗示将在2024年推出AI产品，我们期待在今年WWDC 2024上看到更多相关信息。

二、AniPortrait——让图像开口说话

腾讯开源了AniPortrait技术框架，它可以借助一张人脸照片和音频生成一段高质量的视频。与阿里巴巴的EMO功能类似，AniPortrait可以直接开源，用户可以直接使用。通过这一技术框架，我们可以实现将音频和图像转化为动态视频，并保持人物面部表情流畅、生动且口型一致。此外，AniPortrait还支持多种语言输入和面部重绘等功能。尽管目前还存在对口型不够流畅自然的问题，但腾讯团队计划效仿阿里EMO的方法，直接从音频预测肖像视频的生成，以达到更好的效果。

三、Polaris——医疗领域的智能助手

Polaris是一款由AI初创公司Hippocratic AI开发的大语言模型系统，可以为医疗保健领域提供专业的医疗咨询和指导。Polaris不仅可以与患者进行长时间、多轮次的自然语音对话，还能分析患者的实验报告和生命体征数据，帮助他们解读检查结果，监控健康状况的变化。目前，Polaris已经发布了其二代模型Polaris 2，并在多个维度上表现出与人类护士相当的实力，甚至在某些关键维度上超越了他们。

四、VideoSwap——视频主体无缝替换

VideoSwap是一款由新加坡国立大学和Meta研究团队合作开发的视频编辑模型，支持在不改变视频背景、运动轨迹的前提下替换掉视频主体。只需一张图片，就可以轻松更换视频的主角。该项目取得了SOTA（State of the Arts）成绩，是目前最好的视频变换模型。

五、BasicPBC——动画自动填色

BasicPBC是一项由新加坡南洋理工大学S-lab团队开发的动画自动填色AI技术，能够自动为动画中的线条图着色，极大地提高了动画制作中的上色工作效率。通过简单的操作，用户可以将动画的第一帧进行彩色化，然后BasicPBC就会自动完成后续所有帧的颜色填充。这种技术在人物动作、阴影变化和被遮挡等复杂场景下表现出色。

分秒AI研究院

分秒AI研究院

苹果ChatGPT挑战GPT-4，腾讯Sora3000星，AI领域新突破

分秒AI

发表回复取消回复

分秒AI研究院

分秒AI研究院

苹果ChatGPT挑战GPT-4，腾讯Sora3000星，AI领域新突破

苹果ChatGPT挑战GPT-4，腾讯Sora3000星，AI领域新突破

分秒AI

发表回复 取消回复

发表回复取消回复