🔥兄弟们,AI生成脑洞场景的黑科技直接杀疯了!📸✨
原推文:https://x.com/i/status/2013400580853768392
作者:@berryxia.AI
时间:2026-1-20 11:50:55
💡 核心观点
🔥兄弟们,AI生成脑洞场景的黑科技直接杀疯了!📸✨ CopilotKit(28k star开源大神级框架)整了个Scene Creator Copilot demo,用Gemini 3 + LangGraph,聊天式一键生成人物、背景、完整场景! 随便甩一句“Luke Skywalker in a cubicle”(卢克·天行者在格子间上班),AI先给你整出纯白背景的Luke照片 → 再生成办公格子间背景 → 最后智能组合成完整场景,还支持你中途审批、编辑、拒绝(真·Human-in-the-Loop,绝不翻车)! 全程聊天交互,实时看进度,生成后还能继续迭代:换姿势、改表情、加道具,随便脑洞多大都行!完美适合做meme、故事板、创意图、甚至小说插画! 核心功能接地气说: 1️⃣ 自然语言描述人物/背景/场景 2️⃣ 多步自动生成 + 实时预览 3️⃣ 你说了算:Approve/Execute/Edit/Abort 4️⃣ Generative UI,边聊边出图超丝滑 开源免费,demo已130 star,主项目28k star冲疯! 速去上手玩(只需Google AI API key,几秒启动): …https://t.co/fIOyaMpHOw Repo(速来star冲一波!): https://t.co/Ow8hgTVuwG… 谁先整出个绝活场景晒晒?快来报到!😂💥✌🏻
🧵 深度展开
没有Claude 订阅的可以继续免费使用open code中的一系列免费模型了! 它包括kimi2.5、GLM-4.7、MinMax M2.1 、Big Pickle。
[!NOTE] 补充 2
🚨实时交互游戏梦想成真,这你受得了嘛! Google Genie,还在实验阶段的模型,输入图像或文字提示,即可创建一个鲜活的、不断扩展的世界,它会在您周围实时构建自身。 今天起,Google AI Ultra 订阅用户(仅限美国,18 岁以上)即可使用该功能
[!NOTE] 补充 3
🐳卧槽!这下真的是要实现PPT自由了,香蕉生成的图片PPT可以直接编辑了😄 其实目前所有使用Nano Banana 制作的PPT的工具都是依托于LLM的强能力+优化的AGENT来完成一份还不错的PPT。 也就是说其实你只要有一个不错的提示词或者提示词风格,你大概率制作出来的PPT是不会差的。 昨晚就是使用我设置的号的提示词风格+一句话就可以做出视频中的风格的PPT了。 但是受限于无法直接编辑的问题, @Cydiar404 佬的这个工具就是可以实现帮你解决PPT进行编辑的问题。 目前工具还在内测中,我想应该很快就可以体验了,到时候我找C大给我们社群的小伙伴优先来一波福利哈哈😄
[!NOTE] 补充 4
🔥重磅!阿里也是天天搞事情不断啊! 周末有空了部署在MacStudio上测试一把! Qwen3-ASR 和 Qwen3-ForcedAligner 正式开源啦!专为杂乱的真实音频场景打造,性能能打还超抗造,直接能上生产环境! 支持 52 种语言和方言,还能自动识别语种(含 30 种语言 + 22 种方言 / 口音) 噪音多、环境复杂都不怕,就连唱歌场景也能 hold 住! 长音频友好:单次可处理长达 20 分钟的音频 精准到词 / 短语级的时间戳 通过 Qwen3-ForcedAligner 实现 11 种语言高精度对齐,性能碾压 MFA/CTC/CIF 类对齐工具更贴心的是! 还附带全套开源推理与微调工具栈,支持 vLLM 批量处理、流式传输和异步服务! 地址见评论区~
[!NOTE] 补充 5
一个动作告诉你: Chrome 的家庭“弟位”--> 立马是家庭"帝位"! 其他AI 浏览器估计又要麻了,😁
作者:berryxia.AI | 标签:AI生成 CopilotKit Gemini 3 LangGraph 开源框架
CopilotKit(28k star开源大神级框架)整了个Scene Creator Copilot demo,用Gemini 3 + LangGraph,聊天式一键生成人物、背景、完整场景!
随便甩一句“Luke Skywalker in a cubicle”(卢克·天行者在格子间上班),AI先给你整出纯白背景的Luke照片
![]()
元数据
• 类型:推文
• 标签:#AI #工具 #提示词 #Skills
• 收藏夹:工具 → X Posts/工具