ElevenLabs 发布了一个开源的小项目,X-to-Voice ,允许用户通过分析 Twitter 资料生成自定义的声音和头像。这个项目使用了 ElevenLabs 的新声音设计 API 和 Taedra 动态头像生成工具。 用户可以输入 Twitter...
分类: AI项目
一个完全本地运行的开源语音转文本 API
该项目基于 OpenAI 的 Whisper 模型,并利用 FastAPI 的异步特性对其进行高效包装,支持异步任务队列,文件处理,网络爬虫,以及更多自定义功能。 「Fast-Powerful-Whisper-AI-Services-API 」的愿景是打造一个强大且开箱即用的 Whisper...
TabMark – 新标签页书签管理插件
TabMark 是一款功能强大且简洁的 Chrome 浏览器插件,它为你的浏览体验带来全新的便利。将新标签页打造成专属的书签管理中心,让你轻松访问常用网站,整理和归类书签,提升工作效率!
新版Claude 3.5 Sonnet将可进行电脑操作
Anthropic宣布了升级版 Claude 3.5 Sonnet,以及新模型Haiku。新版在各方面都比前代有显著提升,尤其是在编码方面,这一领域它本来就处于领先地位。 Claude API 还将支持电脑操作,并已进入公共测试阶段。
Gemini Search 一个基于Gemini的AI搜索引擎
一個 Perplexity 風格的搜尋引擎,由 Google 的 Gemini 2.0 Flash 模型提供支持,並以搜尋為基礎。透過即時網路資源和引文獲得人工智慧驅動的問題答案。 Search 是 Perplexity 的 Gemini 版平替,基于
让可穿戴设备无需电池也能工作
Power-over-Skin “皮肤供电”技术 ,让可穿戴设备无需电池也能工作 现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体积,并且需要定期充电和移除设备。...
NoteGen:一个跨平台AI笔记APP
NoteGen 是一个跨平台的笔记 APP,目前支持 Mac、Windows、Linux 开源地址在视频下方的描述中 软件安装完毕后,请先在设置页面配置 API Key 后即可正常使用。 Mac 用户需要配置屏幕录制权限,才可以使用截图记录功能。 同步和图床功能(可选),需要创建 Github...
VITA开源版视频+语音模型
一个开源的多模态大语言模型,旨在实现实时的视觉和语音交互。 能够同时处理视频、图像、文本和音频数据,通过减少交互延迟、增强语音处理能力和改进多模态理解,达到了接近GPT-4o的水平。 顯著降低交互延遲。
Smart Bookmark – AI 智能书签管理插件
智能书签管理器,AI驱动,自动生成标签,语义化搜索,告别繁琐管理。 精准分析页面内容,自动生成标签 支持主流AI模型(OpenAI、通义千问等)
3MinTop – AI 驱动的电子书阅读助手
一款 AI 阅读助手,旨在帮助用户在短时间内掌握书籍的核心内容,培养良好的阅读习惯。 本视频对这个来网站一个實操,体验一下这个电子书阅读助手 它提供每章 3 分钟的精华摘要、简洁明了的内容解析、智能生成思维导图、内置电子书阅读器、全文翻译、内容问答以及进度追踪等。 目前完全免费
帶有微型攝影機的智慧環讓用戶透過點擊來控製家庭設備
雖然家庭中的智慧型設備已經發展到包括揚聲器、安全系統、燈光和恆溫器,但控制它們的方式仍然相對穩定。用戶可以與手機交互,或與技術人員交談,但這些通常不如它們所取代的簡單開關方便:“打開燈…不是那個…調高揚聲器音量…不要那麼大聲!” 華盛頓大學的研究人員開發了 IRIS
Ebook2Audiobook开源项目
将电子书自动转换为有声书 支持语音克隆、多种语言 ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆和章节信息的生成。该项目结合了 Calibre(电子书转换工具)和 Coqui...
开源应用为Win11用户带来于苹果AI的写作功能
一款名为Writing Tools的开源应用为Windows 11用户带来了类似Apple...
一款开源的AI试衣模型,能够精确操控人物的外观和姿势
可控人物影像產生旨在產生以參考影像為條件的人物影像,從而允許精確控制人物的外觀或姿勢。然而,現有方法儘管實現了較高的整體影像質量,但通常會扭曲參考影像的細粒度紋理細節。我們將這些扭曲歸因於對參考影像中相應區域的關注不夠
智音语音助手:一款通用型智能电脑管家
智音语音助手(Zhiyin_Butler)旨在开发一款通用型智能电脑管家,支持在桌面电脑Windows 10/11系统上安装和部署。项目的所有内容遵循Apache License 2.0开源协议,作为通用型电脑管家系统示例供开发者参考学习。
華爾街對DeepSeek的衝擊有不同解讀
美股人工智能概念爆發小股災,英偉達狂瀉近17%收市,市值蒸發5,890億美元,是美股史上單日最多;多隻晶片股跌幅雙位數,納斯達克指數坐挫3%。資金擁向周期股以及與AI關聯較少的股份,道瓊斯指數倒升近300點收市。中國的生成AI模型DeepSeek開放與公眾使用,震撼科技界及華爾街