大模型价格战凶猛。
5月22日,腾讯云全面下调大模型价格,混云-lite宣布免费。
随着成本快速下降,大模型全面普及的拐点已经到来。不过,大模型价格战面向的是B端开发者的,对大多数C端用户来说,大模型依然在“只听其声不见其面”阶段,ChatGPT这一AIGC应用鼻祖成了“玩具”,Sora这样的明星产品无法体验。市场急缺人人能用的大模型应用。
在消费级市场,也有在潜心做大模型产品的玩家,其中来自中国的昆仑万维——天工AI就蹚出了一条自己的路。5月27日,昆仑万维宣布,天工AI APP日活用户(DAU)已超100万,成为极少数进入“DAU百万俱乐部”的消费级AIGC应用,QuestMobile数据则显示,其月活量已逼近千万。作为大模型C端应用的全能型选手,天工AI体验到底如何?
初体验:AI超级应用,真全能“孤品”
去年8月天工AI发布了中国第一款AI搜索产品,引发四面八方的AI产品扎堆搜索领域。随着谷歌发布Genimi demo,可能就连昆仑万维都没想到AI搜索会成为全球AI大战的“炸子鸡”应用。
自天工第一款AI搜索产品上线已过去10个月,现如今的天工AI俨然已升级为AI搜索为主的多模态全能AI孤品。
大多数AIGC应用目前还只通过PC WEB页提供服务,天工AI则支持PC、App、小程序等多渠道,让用户在不同场景可随时随地免费试用:
PC端:www.tiangong.cn;
APP:在应用商店搜索App“天工”,支持手机号码一键登录使用;
小程序:在微信等平台,【天工AI智能助手】小程序使用也十分简单方便。
从网站、App主界面来看,天工AI平台集成了AI搜索、AI文档分析、AI画画、做PPT、音乐生成、视频转绘、AI写作、AI语音对话等主流AIGC应用,本质就是一个AI应用的超级平台。
天工AI支持文字、图片、声音、视频、文档处理等,是第一个真正意义上的多模态AIGC产品。可能很多用户对多模态是什么不大了解,其实多模态就是更自然更好用的人机交互,因为人可以任意多种形式(文字、图片、声音、视频)与机器交互,就像跟人和人交互一样自然。
那么,天工AI能力到底如何?作为一家新媒体机构的创始人,我每天的工作都有大量场景需要使用AIGC,我发现常见的AI需求在平台都有对应的服务可以满足,而且完全免费。
刚好我最近接到了一个体验2024年新款iPad Pro的任务,这个任务串联了天工AI的不少核心功能,给大家分享下我的实操案例。
首先,我试着让天工AI给我一些小红书的文案建议:
答案让人惊喜,天工AI不只是准确地把握了iPad Pro的特性,而且可结合小红书笔记文风加入表情,且每一个表情都不是随意添加的。在文末,天工AI还加入了对小红书推荐效果影响很大话题标签,这份文案给人感觉很“走心”,90%可用。
不过,相较于纯文字而言,小红书用户习惯看图文结合的内容,于是我试着让天工AI给我生成一张iPad Pro的画报用于笔记。
结果也不错,画面简洁大方,颜色明亮鲜艳,还真有一点我要求的“金属质感”。
刚好雷科技今天的推文是关于微软AI PC的,于是我试着让天工AI帮忙制作一张封面图:
这个图剪裁一下就可以用了——美中不足的是logo成了苹果的,但瑕不掩瑜。
如果想要风格不一样的动漫图呢?我试着让天工AI智能体下面的二次元漫画给我制图,主题是乔布斯与iPhone同步出现,结果也同样能直接用。
前些年我们新媒体从业者最担心被图片版权机构敲诈勒索,现在有了天工AI,微信推文的封面图可以自己做了,感觉每年都可以省下一大笔钱了。
除了前面的图片生成功能,天工AI最近还上新了一个宝藏功能【AI视频转绘】,只需上传或者拍摄一段小视频,天工AI就能生成很多不同风格的视频,比如动漫、迪士尼等二次元风格,这个功能可太适合内容创作者了。
在白云机场,我拍摄了一则机场忙碌景象的小视频,想用来制作旅行Vlog。将视频上传到天工AI后,我只需指定“日漫”风格,它就能生成一则格调别致的小视频,还挺带感的:
00:00
/
00:06
倍速
天工AI让人惊喜的功能,不只是图片生成和AI视频转绘,它的AI音乐生成功能同样堪称惊艳。
让每个人都能创作歌曲的Suno一度很火,但Suno AI已开始收费,天工AI则支持免费创建音乐,且体验更接地气,支持选择不同曲风与情绪,一次可生成三个版本,均可免费下载。
我只花了几分钟时间就创作了两首歌曲,大家可以试听:
《明月几时有(电音版)》:
00:00
/
00:32
倍速
《互联网大佬凡尔赛之歌》:
00:00
/
00:12
倍速
特别值得一提的是,天工AI音乐不只是创作工作,也是AI音乐分享与发现社区,AI创建的歌曲可一键投稿到平台,参与相应的激励活动,说不定哪天你也可以作为AI kol在天工上变现了。
据了解,天工AI音乐生成大模型是完全自研的,当前AIGC音乐在国内外都没有公开可用的开源模型,suno也没公开任何技术架构。天工AI音乐生成在4月17日上线时,就对外公开了技术架构。
「天工SkyMusic」自研AI音乐大模型技术架构
「天工SkyMusic」是中国首个音乐SOTA模型,在人声&BGM音质、人声自然度、发音可懂度以及综合评分上超过AIGC音乐鼻祖Suno V3,这是中国自研大模型技术第一次在AIGC领域领跑全球。
在写作时,我经常需要阅读一些专业报告并快速提炼出信息,这是让人十分头疼的活儿,因为阅读一份报告需要很长时间,甚至比写稿本身的时间更多。使用天工AI的文档解析功能,我可以快速得到文档梗概重点,且可以生成脑图,这比传统目录更一目了然。
更强大的地方是,天工AI还能精准回答“手机相关内容在报告哪一页”这样的内容,我写稿要用到对应内容直接到对应页码精读即可,当然如果你不想自己精读,天工AI也支持一健AI速读。有一说一,天工AI的文档解析确实可以大幅节省编辑、记者、公关、研究员、分析师等人群的时间。
除了可以解析PDF等文档外,天工AI生成PPT的能力也不俗,比如我最近准备在公司内部展开一个新媒体内容风控的培训,它直接给我生成了一个框架,我还可以选择不同模版一健生成PPT,整个过程不到两分钟,基本覆盖我要培训的维度,我根据个人经验