苹果ChatGPT挑战GPT-4,腾讯Sora3000星,AI领域新突破
新一代人工智能应用不断涌现,拓宽我们的想象力边界
随着人工智能技术的不断发展,各类创新应用层出不穷。钛媒体AGI特别为您带来了免费的AI“神器”系列第十一弹,本次共推荐五款创意十足的AI应用,它们将为我们展示AI的无限可能。
一、ReALM——让Siri更聪明
ReALM(Real-time Analysis of Live Media)是苹果公司研究团队开发的一款设备端AI模型。这款模型的参数量达到了惊人的8亿,部分性能甚至超过了GPT-4,使其具备理解前后文关系的能力,从而提高反应效率。ReALM不仅适用于实际产品,如ChatGPT,而且可以与各大科技巨头如Google、微软、OpenAI和亚马逊展开竞争。目前尚无法确定苹果是否会将其应用于iPhone、iPad和Mac等设备,但考虑到苹果已多次暗示将在2024年推出AI产品,我们期待在今年WWDC 2024上看到更多相关信息。
二、AniPortrait——让图像开口说话
腾讯开源了AniPortrait技术框架,它可以借助一张人脸照片和音频生成一段高质量的视频。与阿里巴巴的EMO功能类似,AniPortrait可以直接开源,用户可以直接使用。通过这一技术框架,我们可以实现将音频和图像转化为动态视频,并保持人物面部表情流畅、生动且口型一致。此外,AniPortrait还支持多种语言输入和面部重绘等功能。尽管目前还存在对口型不够流畅自然的问题,但腾讯团队计划效仿阿里EMO的方法,直接从音频预测肖像视频的生成,以达到更好的效果。
三、Polaris——医疗领域的智能助手
Polaris是一款由AI初创公司Hippocratic AI开发的大语言模型系统,可以为医疗保健领域提供专业的医疗咨询和指导。Polaris不仅可以与患者进行长时间、多轮次的自然语音对话,还能分析患者的实验报告和生命体征数据,帮助他们解读检查结果,监控健康状况的变化。目前,Polaris已经发布了其二代模型Polaris 2,并在多个维度上表现出与人类护士相当的实力,甚至在某些关键维度上超越了他们。
四、VideoSwap——视频主体无缝替换
VideoSwap是一款由新加坡国立大学和Meta研究团队合作开发的视频编辑模型,支持在不改变视频背景、运动轨迹的前提下替换掉视频主体。只需一张图片,就可以轻松更换视频的主角。该项目取得了SOTA(State of the Arts)成绩,是目前最好的视频变换模型。
五、BasicPBC——动画自动填色
BasicPBC是一项由新加坡南洋理工大学S-lab团队开发的动画自动填色AI技术,能够自动为动画中的线条图着色,极大地提高了动画制作中的上色工作效率。通过简单的操作,用户可以将动画的第一帧进行彩色化,然后BasicPBC就会自动完成后续所有帧的颜色填充。这种技术在人物动作、阴影变化和被遮挡等复杂场景下表现出色。