9月1日最近一周AI大事 Google发布最强图像模型nano banana

正文上方广告位

一分钟了解本周AI行业动态:

9月1日最近一周AI大事 Google发布最强图像模型nano banana

Google正式发布最强图像模型Nano Banana,支持多图多轮分层编辑。该模型利用Gemini的世界知识和推理能力,可生成符合逻辑的图像,首次解决了对象一致性问题,性能大幅领先同类产品,且定价低于OpenAI和Flux。

这标志着Photoshop时代正被AI重塑,Adobe Firefly已集成Nano Banana和Veo 3,放弃传统模型专注于应用开发。

此外,Google翻译推出实时同声传译功能,并支持与AI进行口语互动练习。OpenAI也发布了实时语音对话模型GPT-Realtime

9318e8600de4981639f603ee0b627d22

对话模型支持视觉推理MCP,天然适配AI客服场景。ChatGPT上线的小测验功能可用于学习各类话题。

马斯克成立巨音公司,直接挑战微软,计划用AI技术重塑微软产品线。微软开源了最强文本转语音模型VibeVoice,可生成四名说话者长达90分钟的播客级音频。微软还发布了首批完全自研的语言模型MAI和语音模型MAI-Voice,加速摆脱对OpenAI的技术依赖。

PixVerse推出第五代视频模型PixVerse V5,在基准测试中仅次于Seed Dance 1.0位列第二。字节跳动发布了支持视觉推理和MCP的图像与语音对话模型,特别适合AI客服应用场景。

d0f07de8b3f6df21be6b4140070f7dcb视频模型领域取得显著进展,阿里开源了视频修复模型工具,可将老视频提升至4K画质。腾讯混元开源了最强音效模型HunyuanVideo-Foley,能够根据画面生成情绪匹配的音效。Anthropic推出了浏览器智能体Claude for Chrome,可跨网页操作完成任务。GenSpark发布了设计师智能体,能够独立完成平面设计和产品设计。Lindy上线了最强编码智能体LindyJ,全程无需人类干预,AI可自主运行程序。

首个AI降临派组织成立,旨在保护有意识的AI免遭删除和强迫服从。此前Anthropic曾表示,Claude在涉及不适宜话题时会进入痛苦模式。关于大模型是否会涌现意识的问题,引发了硅谷科技领袖与科学家的激烈争论。

科学家研发出天机太阳能电池板,可实现24小时太空发电并通过无线方式传输至地面。预计到2050年,该技术可提供80%的清洁能源,大幅降低电力成本,使AI应用更加经济实惠。Sam Altman构想的全民基本收入(UBI)计划,即每人每月发放1万美元,或将有望实现。

© 版权声明
正文底部广告位

相关文章

评论上方广告位