挤干水分,真正好用的12个AI工具是这些…

正文上方广告位
eccd0e0e-ac8f-4b1b-a3b0-7ee26070d3fb

AI工具更新的字幕款,最使用好用的到底是哪几个?

204fa720-2146-4a17-a591-eb1b454f87d0

今天总共10个类目超过20款工具,包括AI视频、图片、音乐、做PPT、大约模型、编程等等。每个类目我都会给出最推荐的工具,不做了好人、不模仑难可,一次性盘金处。话不多说,我们开始。

6de714e7-9bb4-4a1a-870b-e584e2b40da4

AI视频生成入围的是这些工具,这里面我个人最推荐的是Runway、Gence和可林,来直接上对比样片。这样的,一位龙骑士骑着巨龙,从骑士和龙头的特写开始,然后缩小镜头展示他们在广阔的山脉和森林中翱翔。这是Runway生成的,指令遵循度还不错,龙头和骑士飞过镜头,甚至龙的翅膀、山洞、遮挡镜头的细节也出来了。再看可林的,指令遵循度最高,整个画面变化的幅度也很大,运镜也很合适。再来试试最新的VO3,VO3最炸裂的是视频和音效可以一起生成。那它这段指令遵循还挺不错的,龙和骑士的主体也没有闪到门口。

dd99917a-a8aa-4729-99e4-0bbf3a08bc68

同步生成的音效比如说龙的嘶哄声,还有山洞翅膀的声音,很真实也比较贴合画面。所以这一段,你从画面上来说,RunwayVO3还有可林算是大成品手哈。再看这一段,提示词是这样的,绿色跑车在纽约的街头飞驰,轮胎发出刺耳的尖叫声,拖叶着熔烟,摄像机动态追逐紧跟。来看Runway的,这一段它的效果最好,你看这车辆飘移甩尾的动作,基本符合物理规律。然后这个轮胎冒烟,车身反射霓虹灯这些细节都挺不错的。再看可林的,车辆飘移啊,轮胎冒烟啊,街景啊这些都还OK,但这个车啊,还是闪动,还是有AI味。再看VIO3的,视频前半段还不错,但是后半段车身直接扭曲翻转了,物理规律直接穿帮了。同步生成的音效,轮胎声音倒是挺真实的,但是呢也没有完全外面配合。

daf35ba6-5604-4d7e-8749-8d2c7679a869

使得下来啊,最核心的视频生成,还是Runway的效果更好更稳定。再对比一下这几个方面,免费额度呢,Runway更多一点。支持的分辨率呢,Runway支持拓展到4K,也比其他的要更高。在AI视频最重要的主题一句信上,Runway的功能也最完善,比如说这一段,同一个人在不同场景的视频,感觉呢都要打爆传统的影视行业了。

da7c16a4-e200-4233-b25c-86a773e5e9fd

Runway还可以用白模3D素材图片,作为视频生产的参考图,因为白模没有杂乱的信息,对画面的控制更加精准。

4390b638-8f17-4f89-bc31-0259a923f2eb

比如先给一张底图,再给一张汽车的白模图,再给一张汽车的样式参考图,最终生产的视频几乎达到了电影集的效果。

26ad6763-5537-47a2-b771-998e3565fd61

所以有条件的推荐Runway,View3都用,没有网络条件的可以用可琳2.1和奇梦3.0。我个人觉得可琳2.1除了主体闪动之外,在其他方面都能和Runway拜拜手腕。有人用可琳做了这个争夺网位的魔幻微电影,如果不告诉我,我还真不一定看得出来是AI做的。

b6efb330-a9ae-456d-84aa-0f14b37feb73

还有奇梦最近更新的3.0版本,效果也还挺好的。

ee2e12c4-7ab1-4dae-a301-12224e3c1e57

这里再给大家推荐几个做短视频非常好用的工具,非常适合大家去整活玩一玩。比如说Vigo,它最好玩的就是可以把视频里的人,切换成你指定的人。

7d7c2aaa-f088-4db6-a61b-7c24ec0f2b87

你们最近在网上看到的这类裹出视频,都可以很快速的用Vigo来实现。

9a2475b5-f629-47ce-aa90-e4060d0c4f76

AI生土工具,入围的有这几个,我最推荐的还是Meat Journey。

0f6762a9-9816-4d9a-83b3-a58a1a8a9fbc

因为它简单能于上手,画质和审美都是顶级的存在。来,我们对比一下它和最近大杂四方的谷歌的Image 4。朗朗是成一张逼真的超现实影迁人写真,指定光线和相机型号,镜头类型等等。这是Meat Journey的。

3b11045f-e768-42a0-8ffe-209661cdf30b

这里不细节,真的跟实拍的有啥区别。

ddef6a92-6605-49bd-8e98-ddd4cd132837

而Image 4,人脸有股油润感,AI为明显要更容易一点。

524ff561-7a8f-4b5b-8aae-32e1ccf73d91

而且Image 4的图片不能做高清放大,而Meat Journey可以。

00040118-6718-43fb-ada1-6275f01713a9

所以,要高质量的真实图片,更推荐Meat Journey。再看这个,主题是雨天公路上的跑车。

052ca21f-f23b-4e9e-a891-44147d628300

放进一张超跑的图片作为主题参考,还有一张雨天公路的图片作为场景参考。

bacb9c3f-5ca9-4df6-9a10-7a2e3a3721d4

再放一张我从跑车广告截取的图作为风格参考。Meat Journey生成的会更真实一点。

cd52582e-8c7e-45ea-b0f7-8e3620c3e547

你看这湿润的路面,跑车尾部都被带起来的水滴,还有远处的闪电,都会更接近真实的世界。

6d20050b-0c1a-4d77-8c3c-bdd21a050357

Image 4生成的呢,车身有闪电包围着,这个明显要更科幻一些,没有Meat Journey那么符合现实的感觉。当然,如果没有条件,国内的可琳、吉梦也是不错的选择。

79809bd3-ca86-449a-82da-45f6d96cceb0

我个人体验下来,在真实感和文字的控制上,吉梦做得更好,而在风格的转绘上,可琳则要好于吉梦。

0d5109db-38cb-4174-bd7b-521d29ca97c1

Junny还推荐TrackGPC4O和Gemini这类的大模型生图。它出图效果比Meat Journey、Image 4这些专用的生图模型要差一些,优点是没有任何使用的门槛,只要你会打字就能用。

5537fb5c-a519-4c83-b01e-9f6b735a4f99

一句话生成这样的真实图,一句话P图。

8cad4a8a-4240-427b-a564-672873db2029

一句话出不同角度的图,并且主体保持一致等等等等。这种用来做一些草稿图,或者封面图都具方便。比如我这两期视频封面就是AI做的。但是哈,前面的这些生图工具,在一致性方面还不是很完美。如果你需要灵活的调整图片局部的细节,做到比较完美的主体一致性。推荐效果最紧的方案,Confi UI加Flux,或者是Stable Diffusion,再加Laura的组合。这套开圆方案,图像质量好,画面细节可控度高,主体一致性最强。比如说我们之前做过的图,用这些图训练的Laura,生成模特的各个角度。正脸,侧脸图都是一致的,人脸保持的很一致。但这个方案,缺点也很突出,就是上手的门槛很高。

5b27486e-5cd1-448a-b478-12b870c27a39

我之前做这期视频工作里,我用了这个方案,光是安装Confi UI,Flex这些,一路各种暴错,花了两三天才把生图的流程跑通,把我整吐血了。实话实说,纯小白,真不介意上手就整这么高难度的。音乐生成,算是现代效果最好的一类AI工具了。最推荐Suno,Suno可以生成有歌词的歌曲,也可以生成纯音乐。特别是最近刚刚更新的Suno 4.5版本,把人生情感做到了极致。来听一下我用Suno 4.5生成的一段音乐。

d902bb48-73e0-4261-ae1c-e1ac09d239fd

这小禅音和小假音,你觉得还有AI味吗?再听一下这几段,看哪个是AI生成的。答案是这样的,除了啊,另外三个全是AI生成的,你猜对了吗?

a3abe021-7de2-45e8-a30b-598c114da2f7

但是哈,Suno更擅长生成代歌词的音乐。如果你需要全音乐,给视频配BGM傻的,Stable Audio更适合你。

7c3f8533-8f5f-4ab7-ae7e-68a90190f875

你可以上传音频样本,比如说哼唱,乐器片段,通过对话给它指定风格。

504061d6-6110-46f2-a5ce-8e3124c169b2

来听一下,上传一段哼唱。

bf53599d-4595-43ec-a20a-90ae70d3626d

让它转化为古典。

a3e45019-d999-4266-a968-def32f5fd454

5个最近出的音乐工具,Music FM DJ和National Gallery Mix Tab也很不错。

26d84f1c-0e5f-41f1-9254-2b66318285d4

Music FX DJ可以让你围绑DJ影。

d2eb45a8-5097-41fb-aefa-dd511b2b6365

你在调音台里通过组合不同的提示词。比如我这里输入钢琴小提琴,合成朋克,控制提示词的权重。调整一下这些参数,来听一下效果哈。还有National Gallery Mix Tab。它可以用图片来生成音乐。

06af28a2-8537-46e6-b1b0-383fc7e20c5d

你可以把经典画作拖拽到乐谱去。它会分析画作的视觉元素、情感基调、时代背景等特征。能要生成风格匹配的音乐,是不是非常的强。还可以添加贴纸进来,控制音乐的风格和情绪。比如说这里加上神秘,民谣,像是音乐,平静的贴纸。效果是这样的。

cde86bde-cfce-473d-b081-0e5bc5c9be13

如果你需要给视频配各种早期小巴的声音和音效,可以用Eleven Labs。

a8c105b7-4212-4ca1-9109-aa3f501a86ee

比如说配鸟叫, 配聪明,配汽笛。

40f59d53-0501-4be8-81ee-d8ad36d264a9

这效果用在电影里面也完全没有问题了。AI做PPT,我内的个人感觉使用性最强的,是百度文库。

53423f18-1306-4ba3-a674-56bc4bd36ff9

它能够在一个画布你根据音频、视频、PDF这些文档,自动提取里面有用的信息,来生成PPT的大纲。

79f45dab-6741-4c5a-aec1-99487fab92b6

我完全不推荐你一句话让AI做个PPT哈,那样肯定得不到你要的效果的。最好的姿势,是你整理好核心的业务内容,做成这种目入层级结构清晰的文档。再把文档给AI,让它帮你搞定PPT模板啊,做排版美画啊,配好看的图表啊,这些费时费力的杂火。

2e78c09a-7ef7-4cbe-8db5-c354c6392e18

当然同一千万豆宝皮米这些,里面都有AI做PPT的功能。我的建议是,看你喜欢谁家的PPT模板就用谁的。海外的AIPPT还是推荐Gamma, 可以从文版大纲指令和网页生成PPT。

32315636-e9a3-477c-b9e4-1d4055253d36

AI模板的排版审美很不错。AI配音工具最推荐国人的,可以简易莫属,上百种男生女生, 还有各地的方言也可以选择。

欢迎一键三连。

美中不足的是,有些声音需要付费才能够用。海外最推荐的还是Eleven Labs,它可以课同声音。

cde254a7-7089-4701-bf1b-a82535a1f226

Eleven Labs每个月有10分钟时长的免费额度,这个额度还挺够用的。如果你想要课隆声音效果最顶, 那就得用这些表格里面开源的配音工具了。

17b1a340-71b2-4142-8150-9633cbb2a947

上手难度要高一点, 比如说GitHub上热度最高的是GBT Service,B站上都有教程。

5eacc426-086f-4e04-9ce8-076a6515d3e9

大约模型入围的是这几个。我最推荐Google Gemini,尤其是最新的2.5 Pro版本,很强。其实从日常的神经验上来说,Germini 2.5,核权GPT4,或者4.5差不多。在我们之前的测试中,他们回答五杯水六个领导怎么分这种开放性的难题的时候,Germini核权GPT的回答,是明显要比其他的模型更好的。为什么更推荐Germini呢?因为它免费的额度更多,我日常使用免费额度就已经完全够了,而且它支持的上下纹长度要更长,你可以一次性为给它更多的资料。现在我们工作时,每期视频的文案做口语化的润色,或者是给视频起标题,像封面的制作思路傻的,我都是把稿子扔给Germini和TrackGPT,然后看它俩给的答案谁更好就用哪一个。我想要搜什么资料都会问这些大模型,某度某个这些搜索引擎已经不怎么用了。如果你需要AI编程, 能不能推荐用Cloud。

d7b9a88a-fc4a-4988-a629-d8fde7c060fd

别看仅几天说Germini 2.5代码能力第一哈,我们指测下来还是Cloud写代码更厉害一点。比如我用同一道Prompt,让Germini 2.5 Pro Preview,而Cloud 3.7 Sonnet,把一个视频可持化成一个网页,这是Germini反复改bug最后给出来的效果哈,这是Cloud一次值出的效果。一次值出的可用性就已经很高,不需要反复的修改。最近新出的Cloud4代码能力又有提升,可以这么说哈,Cloud的编程能力,排行棒没赢过,实测没输过。当然如果你没有条件,我能同意签文,还有豆包也能够满足你大部分的需求了。

7f3d3542-845f-4298-b31b-020e65d3e86d

他们深度搜索功能也都已经上线了。AI知识库是我个人认为现在使用型最强的AI工具,真的就相当于是一个非常给力的秘书,在旁边帮你办公一样。现在我整理资料,照选起灵概,写稿子已经完全离不开它了。主流的知识库,个人感觉体验最好的,是Google的Notebook LM。Notebook LM的优势是,背靠最强的大模型Gemini,有超长的上下根窗口, 你一次可以给它50个门档,总计2500万字,巨量数据的专业书籍,PPT,PDF,网易链接,音频视频链接啥的。

75a47dd6-b2a2-45eb-ad9e-8f4dab2c95c7

扔到Notebook LM里面,它能够读这些词料,甚至一个网易链接,它能够提取你们的视频。然后让它给你解释这些资料,给你答疑,给你总结归纳,它能给出文字,甚至是时间轴, 思维导图这种图表形式的回答,让你看起来非常的清晰意动,很想用过就知道了。

50962332-516b-4d34-a002-df0f9603ccac

Notebook LM还可以把文字内容,做成中文的播客,比如说我上传的水浒传,让它生成男女对话的播客,效果是这样的。

你好,今天我们这儿啊,有一些水浒传的片段,诗内安写的这部经典,讲的就是北宋末年,一帮英雄好汉的事。我们来看看这些节选里,都有些什么。

没错,呃,这些片段呢,就像一扇扇小窗户,能让我们稍微看一眼那个。

你看这个语调,情论, 是不是跟真人差不多了?

a4414b50-7700-4267-b520-d083f46b868c

你还可以直接加入对话,让他们一起讨论内容。Oh hey, our listener wants to join in。What’s up?当然,他生成的应用效果更是顶级,你要是想念口语听力傻的,用这个就很合适。那前几天, 谷歌还展示了NobleVM即将上线的,视频概念功能,可以根据你的资料,顺序一段视频的讲解。

930a8804-3e24-443d-bf00-1f94dbfe32fa

看demo,效果还挺不错,大家可以期待一下。除了这种网页版的知识库,还推荐本地的知识库Obsidian,它最强的点是插件的生态, 非常的丰富,有2000多个插件。

cac48bc7-50ce-4be1-ac8e-d44fb3ec2687

各种细分的功能, 比如说周报日报打标签,管理文件这些,都有插件搞定,比如减长插件Obsidian Clippers,你写作的时候遇到有用的资料,直接点这个logo所有的内容,就一键保存到你的Obsidian库里面了,还帮你打好了属性标签,方便你后面查看,我自己写的东西已经完全离不开这个插件了。

89f47760-6245-4122-849d-bf8bdf9e1604

Obsidian的缺点是只能够上传麦当文件,其他比如说PDF这些文件,要用工具转弯才能够倒进去。

b9fea883-1bbd-4c25-8b44-5bdfa2c4d9dd

和Obsidian NACE的本地知识库,还有Travis Studio,和腾讯的IMA,Travis Studio功能相对单一一点,以对话窗口为主,IMA的优势是和腾讯生态深度整合,可以一键导入公众号文章,感兴趣的都可以去尝试一下。

566a6952-d9cc-461e-bec5-2b2f4792461d

Sighter插件,国内可用,我的最爱,主要是用它来做视频的总结,对视频内容提问,

5d07711b-0f81-4a43-8cbd-ab4c2b9b84e4

B站和油管视频都支持,那这个功能对看长视频, 或者外文视频非常有用,你在开始看之前可以先总结一下,判断这个内容值不值得看。

5b50f2d9-6ba6-41de-b878-c42778be414b

整件式翻译,被称为地表最强的免费翻译插件,实施翻译外语网页,PDF EPUB电子书,视频等,一键即可开启双语阅读, 用母语的速度和外文资料很香。

189f3030-f3c3-4d0f-a00e-03ee11359ae8

如果你要学外语,那强烈推荐Transit,比如说点开英文的视频,

c6209a81-fe02-49a3-8801-3d748702d9ce

可以开启字幕误读模式,可以更好的理解上下文,还有双语字幕的功能, 有了它任何视频都可以成为你的学习的语料。

e2b86a6f-1302-4cd7-8d83-a22665603447

最后是Monica,功能非常强大, 阅读,翻译,写作等各种AI功能都有,缺点是不免费。

95f247a7-30bb-4399-bd22-24417ee532cf

数字人我最推荐的是Hedron, 在海外大厦四方。

Hello everyone,I’m Brianna,the new avatar from HeyGen,one is the chat mode, where you can freely converse with the avatar at your will。

I can generate real-time avatars and videos for various applications。

效果是真的很不错,还是中国人做的,但缺点是国内不能用,国内评级的话可以用简易, 有35种数字人可供选择,但不管哪一个,可能只有直播带货的朋友用得上数字人,而且现在数字人的AI味还是很浓,即使是之前很火的东哥的数字人带货,也是热闹了一下就没有然后了,其实就是因为跟真人的情感差的还挺多的。

2b378c7b-6d1b-4cd4-ae2a-c98a0e964719

AI Agent应该是今年最火的AI弱地的方向了,很多人都开始答AI Agent来解决自己的痛点问题,AI Agent搭建平台我最推荐的是M8N,优点是开源免费,可以本地运行,

db2041b3-e6b1-45d8-b085-bdef038e8e40

也可以用网页版的,有丰富的星辰节点,比如AI节点,第三方应用节点等等,

1be31962-5321-404b-8208-b080e9fa9526

还有一点是社区的生态更好,你可以在社区下载别人开发好的节点,同样开源的还有DeFi,它的上升难度更低,更是小白,国内的还有自己的扣子,阿里的摩扎社区,还有海外的Mac,都是很不错的在线Agent搭建平台,但是这些工具要用得好的话,多多少少还是需要一点编程的概念,建议小白学一点编程的基础支持后再去用,

2a0c7884-ffe3-4214-a0c4-6d341cb0be20

AI编程我觉得是现在,最值得大家去尝鲜的工具,他们正在把软件开发这种高精进的活,从程序员一点点下放给完全不会带满的小白,我最推荐的工具是Curso,你可以在里面全程用嘴编程, 我们之前在这期内容里面分享过,已经有编程小白,用程序器做APP,一年多就实现的财务自由,在AI出现之前,这几乎是不可能做到的,用不上Curso的国内的Tree也不错,还有适合做前端页面的V0。

fe69ab3c-a09e-4f0a-9316-0c923f5a0f61

DEF,还有Figma里面的Mac功能,

76de0c9f-381d-47d3-b30d-13384d198cc3

一句话就能生成可交互的UI界面,还有Bot,有AI辅助的前后端全站编程能力, 适合做应用的早期原型。

03e02d90-39f9-48d5-a39f-c98b8aded494

好了, 这就是本期视频的全部内容了,这里是宣家,谢谢见!

df59c6a2-bba7-4913-8d13-aa202f056620
© 版权声明
正文底部广告位

相关文章

评论上方广告位