挤干水分，真正好用的12个AI工具是这些…

AI工具更新的字幕款，最使用好用的到底是哪几个？

今天总共10个类目超过20款工具，包括AI视频、图片、音乐、做PPT、大约模型、编程等等。每个类目我都会给出最推荐的工具，不做了好人、不模仑难可，一次性盘金处。话不多说，我们开始。

AI视频生成入围的是这些工具，这里面我个人最推荐的是Runway、Gence和可林，来直接上对比样片。这样的，一位龙骑士骑着巨龙，从骑士和龙头的特写开始，然后缩小镜头展示他们在广阔的山脉和森林中翱翔。这是Runway生成的，指令遵循度还不错，龙头和骑士飞过镜头，甚至龙的翅膀、山洞、遮挡镜头的细节也出来了。再看可林的，指令遵循度最高，整个画面变化的幅度也很大，运镜也很合适。再来试试最新的VO3，VO3最炸裂的是视频和音效可以一起生成。那它这段指令遵循还挺不错的，龙和骑士的主体也没有闪到门口。

同步生成的音效比如说龙的嘶哄声，还有山洞翅膀的声音，很真实也比较贴合画面。所以这一段，你从画面上来说，RunwayVO3还有可林算是大成品手哈。再看这一段，提示词是这样的，绿色跑车在纽约的街头飞驰，轮胎发出刺耳的尖叫声，拖叶着熔烟，摄像机动态追逐紧跟。来看Runway的，这一段它的效果最好，你看这车辆飘移甩尾的动作，基本符合物理规律。然后这个轮胎冒烟，车身反射霓虹灯这些细节都挺不错的。再看可林的，车辆飘移啊，轮胎冒烟啊，街景啊这些都还OK，但这个车啊，还是闪动，还是有AI味。再看VIO3的，视频前半段还不错，但是后半段车身直接扭曲翻转了，物理规律直接穿帮了。同步生成的音效，轮胎声音倒是挺真实的，但是呢也没有完全外面配合。

使得下来啊，最核心的视频生成，还是Runway的效果更好更稳定。再对比一下这几个方面，免费额度呢，Runway更多一点。支持的分辨率呢，Runway支持拓展到4K，也比其他的要更高。在AI视频最重要的主题一句信上，Runway的功能也最完善，比如说这一段，同一个人在不同场景的视频，感觉呢都要打爆传统的影视行业了。

Runway还可以用白模3D素材图片，作为视频生产的参考图，因为白模没有杂乱的信息，对画面的控制更加精准。

比如先给一张底图，再给一张汽车的白模图，再给一张汽车的样式参考图，最终生产的视频几乎达到了电影集的效果。

所以有条件的推荐Runway，View3都用，没有网络条件的可以用可琳2.1和奇梦3.0。我个人觉得可琳2.1除了主体闪动之外，在其他方面都能和Runway拜拜手腕。有人用可琳做了这个争夺网位的魔幻微电影，如果不告诉我，我还真不一定看得出来是AI做的。

还有奇梦最近更新的3.0版本，效果也还挺好的。

这里再给大家推荐几个做短视频非常好用的工具，非常适合大家去整活玩一玩。比如说Vigo，它最好玩的就是可以把视频里的人，切换成你指定的人。

你们最近在网上看到的这类裹出视频，都可以很快速的用Vigo来实现。

AI生土工具，入围的有这几个，我最推荐的还是Meat Journey。

因为它简单能于上手，画质和审美都是顶级的存在。来，我们对比一下它和最近大杂四方的谷歌的Image 4。朗朗是成一张逼真的超现实影迁人写真，指定光线和相机型号，镜头类型等等。这是Meat Journey的。

这里不细节，真的跟实拍的有啥区别。

而Image 4，人脸有股油润感，AI为明显要更容易一点。

而且Image 4的图片不能做高清放大，而Meat Journey可以。

所以，要高质量的真实图片，更推荐Meat Journey。再看这个，主题是雨天公路上的跑车。

放进一张超跑的图片作为主题参考，还有一张雨天公路的图片作为场景参考。

再放一张我从跑车广告截取的图作为风格参考。Meat Journey生成的会更真实一点。

你看这湿润的路面，跑车尾部都被带起来的水滴，还有远处的闪电，都会更接近真实的世界。

Image 4生成的呢，车身有闪电包围着，这个明显要更科幻一些，没有Meat Journey那么符合现实的感觉。当然，如果没有条件，国内的可琳、吉梦也是不错的选择。

我个人体验下来，在真实感和文字的控制上，吉梦做得更好，而在风格的转绘上，可琳则要好于吉梦。

Junny还推荐TrackGPC4O和Gemini这类的大模型生图。它出图效果比Meat Journey、Image 4这些专用的生图模型要差一些，优点是没有任何使用的门槛，只要你会打字就能用。

一句话生成这样的真实图，一句话P图。

一句话出不同角度的图，并且主体保持一致等等等等。这种用来做一些草稿图，或者封面图都具方便。比如我这两期视频封面就是AI做的。但是哈，前面的这些生图工具，在一致性方面还不是很完美。如果你需要灵活的调整图片局部的细节，做到比较完美的主体一致性。推荐效果最紧的方案，Confi UI加Flux，或者是Stable Diffusion，再加Laura的组合。这套开圆方案，图像质量好，画面细节可控度高，主体一致性最强。比如说我们之前做过的图，用这些图训练的Laura，生成模特的各个角度。正脸，侧脸图都是一致的，人脸保持的很一致。但这个方案，缺点也很突出，就是上手的门槛很高。

我之前做这期视频工作里，我用了这个方案，光是安装Confi UI，Flex这些，一路各种暴错，花了两三天才把生图的流程跑通，把我整吐血了。实话实说，纯小白，真不介意上手就整这么高难度的。音乐生成，算是现代效果最好的一类AI工具了。最推荐Suno，Suno可以生成有歌词的歌曲，也可以生成纯音乐。特别是最近刚刚更新的Suno 4.5版本，把人生情感做到了极致。来听一下我用Suno 4.5生成的一段音乐。

这小禅音和小假音，你觉得还有AI味吗？再听一下这几段，看哪个是AI生成的。答案是这样的，除了啊，另外三个全是AI生成的，你猜对了吗？

但是哈，Suno更擅长生成代歌词的音乐。如果你需要全音乐，给视频配BGM傻的，Stable Audio更适合你。

你可以上传音频样本，比如说哼唱，乐器片段，通过对话给它指定风格。

来听一下，上传一段哼唱。

让它转化为古典。

5个最近出的音乐工具，Music FM DJ和National Gallery Mix Tab也很不错。

Music FX DJ可以让你围绑DJ影。

你在调音台里通过组合不同的提示词。比如我这里输入钢琴小提琴，合成朋克，控制提示词的权重。调整一下这些参数，来听一下效果哈。还有National Gallery Mix Tab。它可以用图片来生成音乐。

你可以把经典画作拖拽到乐谱去。它会分析画作的视觉元素、情感基调、时代背景等特征。能要生成风格匹配的音乐，是不是非常的强。还可以添加贴纸进来，控制音乐的风格和情绪。比如说这里加上神秘，民谣，像是音乐，平静的贴纸。效果是这样的。

如果你需要给视频配各种早期小巴的声音和音效，可以用Eleven Labs。

比如说配鸟叫，配聪明，配汽笛。

这效果用在电影里面也完全没有问题了。AI做PPT，我内的个人感觉使用性最强的，是百度文库。

它能够在一个画布你根据音频、视频、PDF这些文档，自动提取里面有用的信息，来生成PPT的大纲。

我完全不推荐你一句话让AI做个PPT哈，那样肯定得不到你要的效果的。最好的姿势，是你整理好核心的业务内容，做成这种目入层级结构清晰的文档。再把文档给AI，让它帮你搞定PPT模板啊，做排版美画啊，配好看的图表啊，这些费时费力的杂火。

当然同一千万豆宝皮米这些，里面都有AI做PPT的功能。我的建议是，看你喜欢谁家的PPT模板就用谁的。海外的AIPPT还是推荐Gamma，可以从文版大纲指令和网页生成PPT。

AI模板的排版审美很不错。AI配音工具最推荐国人的，可以简易莫属，上百种男生女生，还有各地的方言也可以选择。

欢迎一键三连。

美中不足的是，有些声音需要付费才能够用。海外最推荐的还是Eleven Labs，它可以课同声音。

Eleven Labs每个月有10分钟时长的免费额度，这个额度还挺够用的。如果你想要课隆声音效果最顶，那就得用这些表格里面开源的配音工具了。

上手难度要高一点，比如说GitHub上热度最高的是GBT Service，B站上都有教程。

大约模型入围的是这几个。我最推荐Google Gemini，尤其是最新的2.5 Pro版本，很强。其实从日常的神经验上来说，Germini 2.5，核权GPT4，或者4.5差不多。在我们之前的测试中，他们回答五杯水六个领导怎么分这种开放性的难题的时候，Germini核权GPT的回答，是明显要比其他的模型更好的。为什么更推荐Germini呢？因为它免费的额度更多，我日常使用免费额度就已经完全够了，而且它支持的上下纹长度要更长，你可以一次性为给它更多的资料。现在我们工作时，每期视频的文案做口语化的润色，或者是给视频起标题，像封面的制作思路傻的，我都是把稿子扔给Germini和TrackGPT，然后看它俩给的答案谁更好就用哪一个。我想要搜什么资料都会问这些大模型，某度某个这些搜索引擎已经不怎么用了。如果你需要AI编程，能不能推荐用Cloud。

别看仅几天说Germini 2.5代码能力第一哈，我们指测下来还是Cloud写代码更厉害一点。比如我用同一道Prompt，让Germini 2.5 Pro Preview，而Cloud 3.7 Sonnet，把一个视频可持化成一个网页，这是Germini反复改bug最后给出来的效果哈，这是Cloud一次值出的效果。一次值出的可用性就已经很高，不需要反复的修改。最近新出的Cloud4代码能力又有提升，可以这么说哈，Cloud的编程能力，排行棒没赢过，实测没输过。当然如果你没有条件，我能同意签文，还有豆包也能够满足你大部分的需求了。

他们深度搜索功能也都已经上线了。AI知识库是我个人认为现在使用型最强的AI工具，真的就相当于是一个非常给力的秘书，在旁边帮你办公一样。现在我整理资料，照选起灵概，写稿子已经完全离不开它了。主流的知识库，个人感觉体验最好的，是Google的Notebook LM。Notebook LM的优势是，背靠最强的大模型Gemini，有超长的上下根窗口，你一次可以给它50个门档，总计2500万字，巨量数据的专业书籍，PPT，PDF，网易链接，音频视频链接啥的。

扔到Notebook LM里面，它能够读这些词料，甚至一个网易链接，它能够提取你们的视频。然后让它给你解释这些资料，给你答疑，给你总结归纳，它能给出文字，甚至是时间轴，思维导图这种图表形式的回答，让你看起来非常的清晰意动，很想用过就知道了。

Notebook LM还可以把文字内容，做成中文的播客，比如说我上传的水浒传，让它生成男女对话的播客，效果是这样的。

你好，今天我们这儿啊，有一些水浒传的片段，诗内安写的这部经典，讲的就是北宋末年，一帮英雄好汉的事。我们来看看这些节选里，都有些什么。

没错，呃，这些片段呢，就像一扇扇小窗户，能让我们稍微看一眼那个。

你看这个语调，情论，是不是跟真人差不多了？

你还可以直接加入对话，让他们一起讨论内容。Oh hey， our listener wants to join in。What’s up？当然，他生成的应用效果更是顶级，你要是想念口语听力傻的，用这个就很合适。那前几天，谷歌还展示了NobleVM即将上线的，视频概念功能，可以根据你的资料，顺序一段视频的讲解。

看demo，效果还挺不错，大家可以期待一下。除了这种网页版的知识库，还推荐本地的知识库Obsidian，它最强的点是插件的生态，非常的丰富，有2000多个插件。

各种细分的功能，比如说周报日报打标签，管理文件这些，都有插件搞定，比如减长插件Obsidian Clippers，你写作的时候遇到有用的资料，直接点这个logo所有的内容，就一键保存到你的Obsidian库里面了，还帮你打好了属性标签，方便你后面查看，我自己写的东西已经完全离不开这个插件了。

Obsidian的缺点是只能够上传麦当文件，其他比如说PDF这些文件，要用工具转弯才能够倒进去。

和Obsidian NACE的本地知识库，还有Travis Studio，和腾讯的IMA，Travis Studio功能相对单一一点，以对话窗口为主，IMA的优势是和腾讯生态深度整合，可以一键导入公众号文章，感兴趣的都可以去尝试一下。

Sighter插件，国内可用，我的最爱，主要是用它来做视频的总结，对视频内容提问，

B站和油管视频都支持，那这个功能对看长视频，或者外文视频非常有用，你在开始看之前可以先总结一下，判断这个内容值不值得看。

整件式翻译，被称为地表最强的免费翻译插件，实施翻译外语网页，PDF EPUB电子书，视频等，一键即可开启双语阅读，用母语的速度和外文资料很香。

如果你要学外语，那强烈推荐Transit，比如说点开英文的视频，

可以开启字幕误读模式，可以更好的理解上下文，还有双语字幕的功能，有了它任何视频都可以成为你的学习的语料。

最后是Monica，功能非常强大，阅读，翻译，写作等各种AI功能都有，缺点是不免费。

数字人我最推荐的是Hedron，在海外大厦四方。

Hello everyone，I’m Brianna，the new avatar from HeyGen，one is the chat mode， where you can freely converse with the avatar at your will。

I can generate real-time avatars and videos for various applications。

效果是真的很不错，还是中国人做的，但缺点是国内不能用，国内评级的话可以用简易，有35种数字人可供选择，但不管哪一个，可能只有直播带货的朋友用得上数字人，而且现在数字人的AI味还是很浓，即使是之前很火的东哥的数字人带货，也是热闹了一下就没有然后了，其实就是因为跟真人的情感差的还挺多的。

AI Agent应该是今年最火的AI弱地的方向了，很多人都开始答AI Agent来解决自己的痛点问题，AI Agent搭建平台我最推荐的是M8N，优点是开源免费，可以本地运行，

也可以用网页版的，有丰富的星辰节点，比如AI节点，第三方应用节点等等，

还有一点是社区的生态更好，你可以在社区下载别人开发好的节点，同样开源的还有DeFi，它的上升难度更低，更是小白，国内的还有自己的扣子，阿里的摩扎社区，还有海外的Mac，都是很不错的在线Agent搭建平台，但是这些工具要用得好的话，多多少少还是需要一点编程的概念，建议小白学一点编程的基础支持后再去用，

AI编程我觉得是现在，最值得大家去尝鲜的工具，他们正在把软件开发这种高精进的活，从程序员一点点下放给完全不会带满的小白，我最推荐的工具是Curso，你可以在里面全程用嘴编程，我们之前在这期内容里面分享过，已经有编程小白，用程序器做APP，一年多就实现的财务自由，在AI出现之前，这几乎是不可能做到的，用不上Curso的国内的Tree也不错，还有适合做前端页面的V0。