挤干水分,真正好用的12个AI工具是这些…

AI工具更新的字幕款,最使用好用的到底是哪几个?

今天总共10个类目超过20款工具,包括AI视频、图片、音乐、做PPT、大约模型、编程等等。每个类目我都会给出最推荐的工具,不做了好人、不模仑难可,一次性盘金处。话不多说,我们开始。

AI视频生成入围的是这些工具,这里面我个人最推荐的是Runway、Gence和可林,来直接上对比样片。这样的,一位龙骑士骑着巨龙,从骑士和龙头的特写开始,然后缩小镜头展示他们在广阔的山脉和森林中翱翔。这是Runway生成的,指令遵循度还不错,龙头和骑士飞过镜头,甚至龙的翅膀、山洞、遮挡镜头的细节也出来了。再看可林的,指令遵循度最高,整个画面变化的幅度也很大,运镜也很合适。再来试试最新的VO3,VO3最炸裂的是视频和音效可以一起生成。那它这段指令遵循还挺不错的,龙和骑士的主体也没有闪到门口。

同步生成的音效比如说龙的嘶哄声,还有山洞翅膀的声音,很真实也比较贴合画面。所以这一段,你从画面上来说,RunwayVO3还有可林算是大成品手哈。再看这一段,提示词是这样的,绿色跑车在纽约的街头飞驰,轮胎发出刺耳的尖叫声,拖叶着熔烟,摄像机动态追逐紧跟。来看Runway的,这一段它的效果最好,你看这车辆飘移甩尾的动作,基本符合物理规律。然后这个轮胎冒烟,车身反射霓虹灯这些细节都挺不错的。再看可林的,车辆飘移啊,轮胎冒烟啊,街景啊这些都还OK,但这个车啊,还是闪动,还是有AI味。再看VIO3的,视频前半段还不错,但是后半段车身直接扭曲翻转了,物理规律直接穿帮了。同步生成的音效,轮胎声音倒是挺真实的,但是呢也没有完全外面配合。

使得下来啊,最核心的视频生成,还是Runway的效果更好更稳定。再对比一下这几个方面,免费额度呢,Runway更多一点。支持的分辨率呢,Runway支持拓展到4K,也比其他的要更高。在AI视频最重要的主题一句信上,Runway的功能也最完善,比如说这一段,同一个人在不同场景的视频,感觉呢都要打爆传统的影视行业了。

Runway还可以用白模3D素材图片,作为视频生产的参考图,因为白模没有杂乱的信息,对画面的控制更加精准。

比如先给一张底图,再给一张汽车的白模图,再给一张汽车的样式参考图,最终生产的视频几乎达到了电影集的效果。

所以有条件的推荐Runway,View3都用,没有网络条件的可以用可琳2.1和奇梦3.0。我个人觉得可琳2.1除了主体闪动之外,在其他方面都能和Runway拜拜手腕。有人用可琳做了这个争夺网位的魔幻微电影,如果不告诉我,我还真不一定看得出来是AI做的。

还有奇梦最近更新的3.0版本,效果也还挺好的。

这里再给大家推荐几个做短视频非常好用的工具,非常适合大家去整活玩一玩。比如说Vigo,它最好玩的就是可以把视频里的人,切换成你指定的人。

你们最近在网上看到的这类裹出视频,都可以很快速的用Vigo来实现。

AI生土工具,入围的有这几个,我最推荐的还是Meat Journey。

因为它简单能于上手,画质和审美都是顶级的存在。来,我们对比一下它和最近大杂四方的谷歌的Image 4。朗朗是成一张逼真的超现实影迁人写真,指定光线和相机型号,镜头类型等等。这是Meat Journey的。

这里不细节,真的跟实拍的有啥区别。

而Image 4,人脸有股油润感,AI为明显要更容易一点。

而且Image 4的图片不能做高清放大,而Meat Journey可以。

所以,要高质量的真实图片,更推荐Meat Journey。再看这个,主题是雨天公路上的跑车。

放进一张超跑的图片作为主题参考,还有一张雨天公路的图片作为场景参考。

再放一张我从跑车广告截取的图作为风格参考。Meat Journey生成的会更真实一点。

你看这湿润的路面,跑车尾部都被带起来的水滴,还有远处的闪电,都会更接近真实的世界。

Image 4生成的呢,车身有闪电包围着,这个明显要更科幻一些,没有Meat Journey那么符合现实的感觉。当然,如果没有条件,国内的可琳、吉梦也是不错的选择。

我个人体验下来,在真实感和文字的控制上,吉梦做得更好,而在风格的转绘上,可琳则要好于吉梦。

Junny还推荐TrackGPC4O和Gemini这类的大模型生图。它出图效果比Meat Journey、Image 4这些专用的生图模型要差一些,优点是没有任何使用的门槛,只要你会打字就能用。

一句话生成这样的真实图,一句话P图。

一句话出不同角度的图,并且主体保持一致等等等等。这种用来做一些草稿图,或者封面图都具方便。比如我这两期视频封面就是AI做的。但是哈,前面的这些生图工具,在一致性方面还不是很完美。如果你需要灵活的调整图片局部的细节,做到比较完美的主体一致性。推荐效果最紧的方案,Confi UI加Flux,或者是Stable Diffusion,再加Laura的组合。这套开圆方案,图像质量好,画面细节可控度高,主体一致性最强。比如说我们之前做过的图,用这些图训练的Laura,生成模特的各个角度。正脸,侧脸图都是一致的,人脸保持的很一致。但这个方案,缺点也很突出,就是上手的门槛很高。

我之前做这期视频工作里,我用了这个方案,光是安装Confi UI,Flex这些,一路各种暴错,花了两三天才把生图的流程跑通,把我整吐血了。实话实说,纯小白,真不介意上手就整这么高难度的。音乐生成,算是现代效果最好的一类AI工具了。最推荐Suno,Suno可以生成有歌词的歌曲,也可以生成纯音乐。特别是最近刚刚更新的Suno 4.5版本,把人生情感做到了极致。来听一下我用Suno 4.5生成的一段音乐。

这小禅音和小假音,你觉得还有AI味吗?再听一下这几段,看哪个是AI生成的。答案是这样的,除了啊,另外三个全是AI生成的,你猜对了吗?

但是哈,Suno更擅长生成代歌词的音乐。如果你需要全音乐,给视频配BGM傻的,Stable Audio更适合你。

你可以上传音频样本,比如说哼唱,乐器片段,通过对话给它指定风格。

来听一下,上传一段哼唱。

让它转化为古典。

5个最近出的音乐工具,Music FM DJ和National Gallery Mix Tab也很不错。

Music FX DJ可以让你围绑DJ影。

你在调音台里通过组合不同的提示词。比如我这里输入钢琴小提琴,合成朋克,控制提示词的权重。调整一下这些参数,来听一下效果哈。还有National Gallery Mix Tab。它可以用图片来生成音乐。

你可以把经典画作拖拽到乐谱去。它会分析画作的视觉元素、情感基调、时代背景等特征。能要生成风格匹配的音乐,是不是非常的强。还可以添加贴纸进来,控制音乐的风格和情绪。比如说这里加上神秘,民谣,像是音乐,平静的贴纸。效果是这样的。

如果你需要给视频配各种早期小巴的声音和音效,可以用Eleven Labs。

比如说配鸟叫, 配聪明,配汽笛。

这效果用在电影里面也完全没有问题了。AI做PPT,我内的个人感觉使用性最强的,是百度文库。

它能够在一个画布你根据音频、视频、PDF这些文档,自动提取里面有用的信息,来生成PPT的大纲。

我完全不推荐你一句话让AI做个PPT哈,那样肯定得不到你要的效果的。最好的姿势,是你整理好核心的业务内容,做成这种目入层级结构清晰的文档。再把文档给AI,让它帮你搞定PPT模板啊,做排版美画啊,配好看的图表啊,这些费时费力的杂火。

当然同一千万豆宝皮米这些,里面都有AI做PPT的功能。我的建议是,看你喜欢谁家的PPT模板就用谁的。海外的AIPPT还是推荐Gamma, 可以从文版大纲指令和网页生成PPT。

AI模板的排版审美很不错。AI配音工具最推荐国人的,可以简易莫属,上百种男生女生, 还有各地的方言也可以选择。
欢迎一键三连。
美中不足的是,有些声音需要付费才能够用。海外最推荐的还是Eleven Labs,它可以课同声音。

Eleven Labs每个月有10分钟时长的免费额度,这个额度还挺够用的。如果你想要课隆声音效果最顶, 那就得用这些表格里面开源的配音工具了。

上手难度要高一点, 比如说GitHub上热度最高的是GBT Service,B站上都有教程。

大约模型入围的是这几个。我最推荐Google Gemini,尤其是最新的2.5 Pro版本,很强。其实从日常的神经验上来说,Germini 2.5,核权GPT4,或者4.5差不多。在我们之前的测试中,他们回答五杯水六个领导怎么分这种开放性的难题的时候,Germini核权GPT的回答,是明显要比其他的模型更好的。为什么更推荐Germini呢?因为它免费的额度更多,我日常使用免费额度就已经完全够了,而且它支持的上下纹长度要更长,你可以一次性为给它更多的资料。现在我们工作时,每期视频的文案做口语化的润色,或者是给视频起标题,像封面的制作思路傻的,我都是把稿子扔给Germini和TrackGPT,然后看它俩给的答案谁更好就用哪一个。我想要搜什么资料都会问这些大模型,某度某个这些搜索引擎已经不怎么用了。如果你需要AI编程, 能不能推荐用Cloud。

别看仅几天说Germini 2.5代码能力第一哈,我们指测下来还是Cloud写代码更厉害一点。比如我用同一道Prompt,让Germini 2.5 Pro Preview,而Cloud 3.7 Sonnet,把一个视频可持化成一个网页,这是Germini反复改bug最后给出来的效果哈,这是Cloud一次值出的效果。一次值出的可用性就已经很高,不需要反复的修改。最近新出的Cloud4代码能力又有提升,可以这么说哈,Cloud的编程能力,排行棒没赢过,实测没输过。当然如果你没有条件,我能同意签文,还有豆包也能够满足你大部分的需求了。

他们深度搜索功能也都已经上线了。AI知识库是我个人认为现在使用型最强的AI工具,真的就相当于是一个非常给力的秘书,在旁边帮你办公一样。现在我整理资料,照选起灵概,写稿子已经完全离不开它了。主流的知识库,个人感觉体验最好的,是Google的Notebook LM。Notebook LM的优势是,背靠最强的大模型Gemini,有超长的上下根窗口, 你一次可以给它50个门档,总计2500万字,巨量数据的专业书籍,PPT,PDF,网易链接,音频视频链接啥的。

扔到Notebook LM里面,它能够读这些词料,甚至一个网易链接,它能够提取你们的视频。然后让它给你解释这些资料,给你答疑,给你总结归纳,它能给出文字,甚至是时间轴, 思维导图这种图表形式的回答,让你看起来非常的清晰意动,很想用过就知道了。

Notebook LM还可以把文字内容,做成中文的播客,比如说我上传的水浒传,让它生成男女对话的播客,效果是这样的。
你好,今天我们这儿啊,有一些水浒传的片段,诗内安写的这部经典,讲的就是北宋末年,一帮英雄好汉的事。我们来看看这些节选里,都有些什么。
没错,呃,这些片段呢,就像一扇扇小窗户,能让我们稍微看一眼那个。
你看这个语调,情论, 是不是跟真人差不多了?

你还可以直接加入对话,让他们一起讨论内容。Oh hey, our listener wants to join in。What’s up?当然,他生成的应用效果更是顶级,你要是想念口语听力傻的,用这个就很合适。那前几天, 谷歌还展示了NobleVM即将上线的,视频概念功能,可以根据你的资料,顺序一段视频的讲解。

看demo,效果还挺不错,大家可以期待一下。除了这种网页版的知识库,还推荐本地的知识库Obsidian,它最强的点是插件的生态, 非常的丰富,有2000多个插件。

各种细分的功能, 比如说周报日报打标签,管理文件这些,都有插件搞定,比如减长插件Obsidian Clippers,你写作的时候遇到有用的资料,直接点这个logo所有的内容,就一键保存到你的Obsidian库里面了,还帮你打好了属性标签,方便你后面查看,我自己写的东西已经完全离不开这个插件了。

Obsidian的缺点是只能够上传麦当文件,其他比如说PDF这些文件,要用工具转弯才能够倒进去。

和Obsidian NACE的本地知识库,还有Travis Studio,和腾讯的IMA,Travis Studio功能相对单一一点,以对话窗口为主,IMA的优势是和腾讯生态深度整合,可以一键导入公众号文章,感兴趣的都可以去尝试一下。

Sighter插件,国内可用,我的最爱,主要是用它来做视频的总结,对视频内容提问,

B站和油管视频都支持,那这个功能对看长视频, 或者外文视频非常有用,你在开始看之前可以先总结一下,判断这个内容值不值得看。

整件式翻译,被称为地表最强的免费翻译插件,实施翻译外语网页,PDF EPUB电子书,视频等,一键即可开启双语阅读, 用母语的速度和外文资料很香。

如果你要学外语,那强烈推荐Transit,比如说点开英文的视频,

可以开启字幕误读模式,可以更好的理解上下文,还有双语字幕的功能, 有了它任何视频都可以成为你的学习的语料。

最后是Monica,功能非常强大, 阅读,翻译,写作等各种AI功能都有,缺点是不免费。

数字人我最推荐的是Hedron, 在海外大厦四方。
Hello everyone,I’m Brianna,the new avatar from HeyGen,one is the chat mode, where you can freely converse with the avatar at your will。
I can generate real-time avatars and videos for various applications。
效果是真的很不错,还是中国人做的,但缺点是国内不能用,国内评级的话可以用简易, 有35种数字人可供选择,但不管哪一个,可能只有直播带货的朋友用得上数字人,而且现在数字人的AI味还是很浓,即使是之前很火的东哥的数字人带货,也是热闹了一下就没有然后了,其实就是因为跟真人的情感差的还挺多的。

AI Agent应该是今年最火的AI弱地的方向了,很多人都开始答AI Agent来解决自己的痛点问题,AI Agent搭建平台我最推荐的是M8N,优点是开源免费,可以本地运行,

也可以用网页版的,有丰富的星辰节点,比如AI节点,第三方应用节点等等,

还有一点是社区的生态更好,你可以在社区下载别人开发好的节点,同样开源的还有DeFi,它的上升难度更低,更是小白,国内的还有自己的扣子,阿里的摩扎社区,还有海外的Mac,都是很不错的在线Agent搭建平台,但是这些工具要用得好的话,多多少少还是需要一点编程的概念,建议小白学一点编程的基础支持后再去用,

AI编程我觉得是现在,最值得大家去尝鲜的工具,他们正在把软件开发这种高精进的活,从程序员一点点下放给完全不会带满的小白,我最推荐的工具是Curso,你可以在里面全程用嘴编程, 我们之前在这期内容里面分享过,已经有编程小白,用程序器做APP,一年多就实现的财务自由,在AI出现之前,这几乎是不可能做到的,用不上Curso的国内的Tree也不错,还有适合做前端页面的V0。

DEF,还有Figma里面的Mac功能,

一句话就能生成可交互的UI界面,还有Bot,有AI辅助的前后端全站编程能力, 适合做应用的早期原型。

好了, 这就是本期视频的全部内容了,这里是宣家,谢谢见!
