摘要:
VoiceCraft 是由德克萨斯大学奥斯汀、Meta FAIR、Rembrand 等团队合作推出的零样本语音编辑与 TTS(文本转语音)开源项目。它仅需几秒钟的参考音频即可实现语音克隆、插入、删除、替换等编辑功能,同时支持零样本文本转语音,并在有声书、短视频、播客等“真实场景音频”中展现出超越 XTTS-v2、VALL‑E 等前沿模型的性能。 阅读全文
posted @ 2025-08-01 18:50
小华同学ai
阅读(56)
评论(0)
推荐(0)
摘要:
binary-husky/gpt_academic 是一款集成 GPT/GLM 类大模型的学术写作优化神器,学术界和科研领域都在快速拥抱大语言模型 (LLM),但真正能助力论文阅读、润色、写作的工具却少之又少。gpt_academic(GPT 学术优化)正是为此诞生:聚焦论文生产全流程,从阅读理解、翻译润色、结构优化,到理工项目剖析,提供一站式解决方案。 阅读全文
posted @ 2025-08-01 18:43
小华同学ai
阅读(198)
评论(0)
推荐(0)
摘要:
Cradle 是由 BAAI‑Agents 团队开源的一款面向 通用计算机控制(GCC) 的多模态 AI Agent 框架,可以让大型多模态模型,通过截图输入和键鼠输出,像人一样使用各种软件和游戏。 阅读全文
posted @ 2025-08-01 18:39
小华同学ai
阅读(179)
评论(0)
推荐(0)
摘要:
一个多平台通吃的社交媒体数据爬虫工具,轻松爬取小红书、抖音、快手、B站、微博、知乎等内容,支持视频、图片、评论、点赞等,真正低门槛、战力强大。 阅读全文
posted @ 2025-08-01 18:29
小华同学ai
阅读(1839)
评论(0)
推荐(0)
摘要:
“Champ” 致力于从一张静态人物图生成流畅连续的人体动画,支撑精准姿态控制与形状一致性,其核心思路是将 3D 参数化人体模型(SMPL)引入扩散模型: 阅读全文
posted @ 2025-08-01 18:06
小华同学ai
阅读(126)
评论(0)
推荐(0)
摘要:
AMIS(前端低代码框架)是百度开源的低代码前端框架,基于纯 JSON 配置即可生成完整后台页面,包括表单、表格、图表、CRUD 列表,支持可视化拖拽编辑。,星标数已达 18.4k,百度内部已沉淀超过 5 万个页面,广泛应用于审核系统、数据管理后台、模型监控等落地场景 阅读全文
posted @ 2025-08-01 17:42
小华同学ai
阅读(183)
评论(0)
推荐(0)
浙公网安备 33010602011771号