当前位置:

【每日AI快讯】4月26日 周五

什么软件好
2024-04-26 10:19:13
 104人浏览

04月26日  周五

💡 加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

字节跳动技术团队提出了一种名为 Hyper-SD 的轨迹分段一致性模型,旨在加速扩散模型的推理过程。该模型结合了轨迹保持蒸馏和轨迹重构蒸馏两种策略的优点,在压缩去噪步数的同时保持接近无损的性能。通过大量实验和用户评测的验证,Hyper-SD 在 SDXL 和 SD1.5 两种架构上都能在 1 到 8 步生成中实现 SOTA 级别的图像生成性能。项目开源并得到了 Huggingface 首席执行官 Clem Delangue 的肯定。

来源:机器之心


💡 8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare

字节跳动、华东师范大学和华中科技大学的合作团队提出了一种名为TextSquare的新策略,旨在缩小开源多模态大模型(MLLM)与闭源模型(如GPT4V和Gemini)在文本中心的视觉问答(VQA)领域的性能差距。他们构建了一个包含千万级指令微调数据集(Square-10M),并通过Square策略,利用多模态大模型生成VQA数据。TextSquare-8B模型在多个基准测试中取得了与GPT4V和Gemini相当的性能,甚至在某些方面超过了这些闭源模型。该研究还推导了指令调整数据集规模、收敛损失和模型性能之间的关系,为进一步构建更大的数据集提供了指导。

来源:机器之心


💡 仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型

Snowflake发布了名为Arctic的大型语言模型,专注于企业内部应用,采用Apache 2.0许可,提供对权重和代码的开放访问,并计划开源所有数据方案和研究发现。Arctic的上下文窗口设置为4K,正在开发基于注意力池的滑动窗口实现,支持无限序列生成,并计划扩展到32K注意力窗口。Arctic在企业智能指标上表现出色,包括SQL生成、编程和指令遵循等方面,且其训练成本远低于其他模型。研究团队采用了独特的Dense-MoE混合transformer架构,通过通信计算重叠,实现了良好的训练效率。此外,Arctic还在学术基准上进行了评估,涉及世界知识、常识推理和数学能力,并与NVIDIA合作进行推理优化,计划在不久的将来为企业用例实现Arctic的高效推理。

来源:机器之心


💡 OpenAI和Moderna合作,推进mRNA医学

Moderna 和 OpenAI 继续合作,共同创新,共同愿景是 AI 在未来商业和医疗保健领域的变革潜力。Moderna 是 mRNA 医学领域的领导者,利用机器学习的力量,已与 OpenAI 合作推出了内部 ChatGPT 实例 mChat,并部署了 ChatGPT Enterprise。这些 AI 工具已嵌入到 Moderna 的业务职能中,帮助推动自动化和生产力,如 Dose ID GPT 使用 ChatGPT Enterprise 的数据分析功能评估疫苗剂量。Moderna 和 OpenAI 都具有研究驱动的价值观,致力于通过 mRNA 药物为人们带来最大的影响。

来源:机器之心


💡 三星 OneUI 6.1.1 有望搭载“视频 AI”功能,预计 7 月发布会亮相

三星计划在OneUI 6.1.1中推出“视频 AI”功能,预计这项功能将允许用户通过描述词生成视频。此外,One UI 6.1.1可能会在今年7月的三星Unpacked活动中与Galaxy Z Fold6和Galaxy Z Flip6一起推出。据报道,三星还将发布Galaxy Ring智能戒指,预计该戒指将拥有各种AI功能,以满足用户的个性化需求体验。

来源:IT之家


💡 Adobe 演示AI工具 VideoGigaGAN:视频分辨率从 128×128 提升到 1024*1024

Adobe 最近展示了一款名为 VideoGigaGAN 的新 AI 工具,这款工具利用上采样技术可以将视频分辨率从 128×128 提升到 1024*1024。VideoGigaGAN 是基于 GigaGAN 的生成视频超分辨率(VSR)模型,能够生成具有高频细节和时间一致性的视频。研究人员为了确保时间一致性,在解码器块中添加了时间注意力层,将图像上采样器扩展为视频上采样器。

来源:IT之家


标签:
评论 0
登录后即可发布评论
提交