当前位置:
【每日AI快讯】5月6日 周一
05月06日 周一
💡 特斯拉机器人“进厂打工”:会分拣电池、自我矫正 步速提高30%
特斯拉的人形机器人“擎天柱(Optimus)”在最新进展视频中展示了其在工厂环境中执行任务的能力,如分拣电池电芯并插入托盘。特斯拉已训练并部署了神经网络,使得Optimus能够执行这些任务。该神经网络仅使用2D摄像头、手部触觉及压力传感器的数据,便能直接生成关节控制序列。目前Optimus正在特斯拉自家工厂中进行测试,人工干预概率持续下降。马斯克预计到今年年底,Optimus将在工厂执行“有用的任务”,并计划在2025年底之前对外销售Optimus。中航证券的报告指出,随着Optimus的量产,预计2030年人形机器人累计需求将达到约200万台,市场空间约5700亿元。分析师建议关注执行器、传感器、核心加工设备、降本新技术方向等投资方向。
💡 AI知道苹果是什么吗?DeepMind语言模型科学家正把这些概念变得可量化、可测试
Ellie Pavlick,一位专注于研究语言模型的计算机科学家,致力于在大语言模型(LLM)中寻找“理解”的证据。她认为,意义涉及概念,并且语言模型中存在某种内部结构,可以代表这些概念。Pavlick的研究集中在描述这种内部结构,并探索它们如何与语言模型行为相关联。她发现了一些有趣的例子,例如模型中的一个“检索首都城市”向量,它似乎在总结这些小概念,并对它们应用通用算法。此外,Pavlick还研究了“基础”概念,即单词的含义是否取决于独立于语言本身而存在的事物。她发现,即使语言模型没有视觉输入,它们也能理解颜色之间的关系,例如,通过RGB代码来映射颜色。这表明模型的内部颜色表示存在某种一致性。
💡 参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?
Octopus v3模型是一个专门为边缘设备优化的多模态语言模型,参数量控制在10亿以内,能够同时处理英文和中文。实验表明,该模型能在资源受限的终端设备上高效运行,如树莓派。多模态语言模型通过处理整合文本、图像等多模态数据,理解和生成近乎人类的回复,相比传统语言模型是一大飞跃。多模态 AI 系统的发展有望实现人工智能技术的民主化,让更广泛的用户和行业受益。Octopus v3模型的开发采用了多阶段训练,包括分别训练因果语言模型和图像编码器,然后合并训练以同步图像和文本处理能力,最后采用强化学习进一步优化模型。在评估中,该模型在智能手机API转换为functional token的演示中表现可与GPT-4V和GPT-4的组合相媲美,展现出高度专业化的AI系统的潜力。
💡 邮件曝光,微软为追谷歌脚步才投资了OpenAI,纳德拉回应:才不是
微软与OpenAI的关系非常紧密,微软对OpenAI的依赖源于其优异的产品以及微软对其他科技巨头的恐惧。2019年,微软的首席技术官Kevin Scott警告微软联合创始人比尔-盖茨和CEO纳德拉,谷歌在人工智能方面已经领先太多,如果不投资OpenAI,微软可能永远也赶不上。随后,微软向OpenAI投资超过130亿美元,将其模型添加到多个产品中。这一投资帮助微软在人工智能领域稳坐巨头位置。欧盟曾怀疑微软暗中控制OpenAI,但最终撤销了这一调查。微软将人工智能和安全作为2024年及以后的两大重点领域,表明其产品中人工智能功能的推广速度不会放缓。
💡 面壁智能发布 Eurux-8x22B 开源大模型:代码性能超越 Llama3-70B
面壁智能最近发布了名为Eurux-8x22B的开源大模型,包括Eurux-8x22B-NCA和Eurux-8x22B-KTO两个版本,主要特点是强大的推理能力。在官方测试中,Eurux-8x22B在LeetCode和TheoremQA测试中表现出色,超过了Llama3-70B和闭源的GPT-3.5-Turbo。Eurux-8x22B模型拥有39B的激活参数,支持64k的上下文长度,是在UltraInteract对齐数据集上训练而成的,这个数据集专门设计用于提升大模型的推理能力。
💡 新加坡国立大学医院新建消化健康中心:利用 AI 量化打分、可检测早期癌症迹象
新加坡国立大学医院正在建设一个新的消化系统健康中心,预计将于2025年上半年竣工。该中心将整合一系列AI技术,以提升消化系统疾病的早期检测、诊断、治疗和预防标准。新中心将配备计算机辅助的AI系统,包括检测、诊断和品质控制,这些系统能够更有效地识别早期胃肠道病变并进行实时量化打分的癌症诊断。新加坡国立大学医院肠胃与肝脏科主任李冠辉副教授指出,AI系统能够更准确地检测疑似癌症的情况,有助于早期发现并减少患者接受开刀和化疗的痛苦。此外,医院还启用了东南亚首台3D成像的Artis Q系统,以增强外科医生确定病变组织位置的能力。