分类: 开源项目

Google 发明了一种估算照片中光照条件的新方法

该技术可以在照片中加入一个看起来像是真实反射环境的铬球。这个铬球可以帮助计算出照片中的光照是怎样的。 然后,他们使用这些光照信息在照片中添加新的物体,使得这些物体看起来好像是在原来的光照条件下拍摄的一样。

GEO的概念:生成引擎优化

个专门针对生成引擎的印象度量标准! 实验表明,使用GEO的简单策略可以在商业生成引擎上显著提高内容的可见性,提升幅度高达40%。

M2UGen:多模态音乐理解和生成模型

M2UGen能够理解各种音乐,包括风格、演奏乐器、表达的情绪情感等,并进行音乐问答。 而且还能根据文本、图像、视频和音频生成各种音乐,同时对生成的音乐也能理解并根据文字描述对音乐进行编辑。

苹果发布了一个多模态大模型

苹果12月14日释放了一个名为Ferret的多模态大语言模型,该模型不仅可以准确识别图像并描述其内容。 同时它还能够识别和定位图像中的各种元素,无论你用怎样的方式描述图像内容,Ferret都能准确地在图像中找到并识别出来。

退出移动版