04月26日周五

💡 加速扩散模型，最快1步生成SOTA级图片，字节Hyper-SD开源了

字节跳动技术团队提出了一种名为 Hyper-SD 的轨迹分段一致性模型，旨在加速扩散模型的推理过程。该模型结合了轨迹保持蒸馏和轨迹重构蒸馏两种策略的优点，在压缩去噪步数的同时保持接近无损的性能。通过大量实验和用户评测的验证，Hyper-SD 在 SDXL 和 SD1.5 两种架构上都能在 1 到 8 步生成中实现 SOTA 级别的图像生成性能。项目开源并得到了 Huggingface 首席执行官 Clem Delangue 的肯定。

来源：机器之心

💡 8B文字多模态大模型指标逼近GPT4V，字节、华师、华科联合提出TextSquare

字节跳动、华东师范大学和华中科技大学的合作团队提出了一种名为TextSquare的新策略，旨在缩小开源多模态大模型（MLLM）与闭源模型（如GPT4V和Gemini）在文本中心的视觉问答（VQA）领域的性能差距。他们构建了一个包含千万级指令微调数据集（Square-10M），并通过Square策略，利用多模态大模型生成VQA数据。TextSquare-8B模型在多个基准测试中取得了与GPT4V和Gemini相当的性能，甚至在某些方面超过了这些闭源模型。该研究还推导了指令调整数据集规模、收敛损失和模型性能之间的关系，为进一步构建更大的数据集提供了指导。

来源：机器之心

💡 仅需Llama3 1/17的训练成本，Snowflake开源128x3B MoE模型

Snowflake发布了名为Arctic的大型语言模型，专注于企业内部应用，采用Apache 2.0许可，提供对权重和代码的开放访问，并计划开源所有数据方案和研究发现。Arctic的上下文窗口设置为4K，正在开发基于注意力池的滑动窗口实现，支持无限序列生成，并计划扩展到32K注意力窗口。Arctic在企业智能指标上表现出色，包括SQL生成、编程和指令遵循等方面，且其训练成本远低于其他模型。研究团队采用了独特的Dense-MoE混合transformer架构，通过通信计算重叠，实现了良好的训练效率。此外，Arctic还在学术基准上进行了评估，涉及世界知识、常识推理和数学能力，并与NVIDIA合作进行推理优化，计划在不久的将来为企业用例实现Arctic的高效推理。

来源：机器之心

💡 OpenAI和Moderna合作，推进mRNA医学

Moderna 和 OpenAI 继续合作，共同创新，共同愿景是 AI 在未来商业和医疗保健领域的变革潜力。Moderna 是 mRNA 医学领域的领导者，利用机器学习的力量，已与 OpenAI 合作推出了内部 ChatGPT 实例 mChat，并部署了 ChatGPT Enterprise。这些 AI 工具已嵌入到 Moderna 的业务职能中，帮助推动自动化和生产力，如 Dose ID GPT 使用 ChatGPT Enterprise 的数据分析功能评估疫苗剂量。Moderna 和 OpenAI 都具有研究驱动的价值观，致力于通过 mRNA 药物为人们带来最大的影响。

来源：机器之心

💡 三星 OneUI 6.1.1 有望搭载“视频 AI”功能，预计 7 月发布会亮相

三星计划在OneUI 6.1.1中推出“视频 AI”功能，预计这项功能将允许用户通过描述词生成视频。此外，One UI 6.1.1可能会在今年7月的三星Unpacked活动中与Galaxy Z Fold6和Galaxy Z Flip6一起推出。据报道，三星还将发布Galaxy Ring智能戒指，预计该戒指将拥有各种AI功能，以满足用户的个性化需求体验。

来源：IT之家

💡 Adobe 演示AI工具 VideoGigaGAN：视频分辨率从 128×128 提升到 1024*1024

Adobe 最近展示了一款名为 VideoGigaGAN 的新 AI 工具，这款工具利用上采样技术可以将视频分辨率从 128×128 提升到 1024*1024。VideoGigaGAN 是基于 GigaGAN 的生成视频超分辨率（VSR）模型，能够生成具有高频细节和时间一致性的视频。研究人员为了确保时间一致性，在解码器块中添加了时间注意力层，将图像上采样器扩展为视频上采样器。

来源：IT之家

当前位置：
资讯中心 /快讯/文章详情/

【每日AI快讯】4月26日周五

04月26日周五

💡 加速扩散模型，最快1步生成SOTA级图片，字节Hyper-SD开源了

💡 8B文字多模态大模型指标逼近GPT4V，字节、华师、华科联合提出TextSquare

💡 仅需Llama3 1/17的训练成本，Snowflake开源128x3B MoE模型

💡 OpenAI和Moderna合作，推进mRNA医学

💡 三星 OneUI 6.1.1 有望搭载“视频 AI”功能，预计 7 月发布会亮相

💡 Adobe 演示AI工具 VideoGigaGAN：视频分辨率从 128×128 提升到 1024*1024

当前位置： 资讯中心 /快讯/文章详情/

【每日AI快讯】4月26日 周五

04月26日 周五

💡 加速扩散模型，最快1步生成SOTA级图片，字节Hyper-SD开源了

💡 8B文字多模态大模型指标逼近GPT4V，字节、华师、华科联合提出TextSquare

💡 仅需Llama3 1/17的训练成本，Snowflake开源128x3B MoE模型

💡 OpenAI和Moderna合作，推进mRNA医学

💡 三星 OneUI 6.1.1 有望搭载“视频 AI”功能，预计 7 月发布会亮相

💡 Adobe 演示AI工具 VideoGigaGAN：视频分辨率从 128×128 提升到 1024*1024

当前位置：
资讯中心 /快讯/文章详情/

【每日AI快讯】4月26日周五

04月26日周五