当前位置:

【每日AI快讯】6月4日 周二

什么软件好
2024-06-04 10:06:49
 179人浏览

06月04日  周二

💡 Nature重磅:微软潘海峰华盛顿大学王晟团队发布首个全切片数字病理学模型GigaPath

GigaPath是由微软研究院、美国Providence医疗网络和华盛顿大学的研究人员共同开发的数字病理学模型,旨在解决全切片尺度下数字病理学图片的高效处理和理解问题。该模型采用两阶段级联结构,包括使用DINOv2的图块级预训练和使用带有LongNet的全切片级预训练。GigaPath在26个任务中取得了领先效果,包括9个癌症分型和17项病理组学任务。该研究强调了全切片尺度建模和大规模真实世界数据预训练的重要性,并为更先进的癌症护理和临床发现提供了新的可能性。相关研究以《A whole-slide foundation model for digital pathology from real-world data》为题,发表在《Nature》上。

来源:机器之心


💡 ​斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库

斯坦福大学的一个研究团队最近发布了一个名为Llama3-V的多模态模型,声称仅需500美元就可以基于Llama3训练出一个性能与GPT4-V、Gemini Ultra和Claude Opus相当的多模态模型,但模型大小仅为这些模型的十分之一。然而,Llama3-V发布后不久就遭到了质疑,有人指出该项目似乎窃取了清华大学自然语言处理实验室与面壁智能合作开发的多模态模型MiniCPM-Llama3-V 2.5。经过调查,发现Llama3-V的代码几乎完全照抄了MiniCPM-Llama3-V 2.5,只是进行了少量格式上的修改。此外,Llama3-V的作者在回应质疑时出现了时间错位,加重了大家的怀疑。Llama3-V的作者之一后来站出来道歉,称「抄袭」源于对队友Mustafa的盲信。但这一行为引起了广泛的关注和讨论,有人认为这是关乎道德、诚信与声誉的问题,如果抄袭得到验证,斯坦福大学应该介入调查。

来源:机器之心


💡 机器人时代已来!黄仁勋指向AI下一波浪潮:物理AI

在COMPUTEX大会的开幕主题演讲中,英伟达CEO黄仁勋强调了机器人和AI在未来发展中的重要性,指出物理AI将成为AI的新浪潮。物理AI是指能够执行与智能生物体相关的任务的实体系统,能够实现机体、控制、形态、动作执行和感知的协同进化。黄仁勋表示,大多数AI并不理解物理定律,而生成图像、视频、3D图形和许多物理现象需要基于物理并理解物理定律的AI。他指出,机器人时代已经到来,AI的下一波浪潮已经到来,由物理AI驱动的机器人技术将彻底改变行业。黄仁勋还提到,机器人并不局限于人形机器人,一切移动的物体都将实现自主运行。英伟达正在开发由物理AI驱动的机器人,这些AI模型能够理解指令,并在现实世界中自主执行复杂任务。此外,英伟达内部也已组建研究小组GEAR,致力于通用具身智能体研究,目标是打造具备通用能力的AI,能在虚拟与现实的多个世界中学习如何熟练行动。随着AI的这一把火从聊天机器人烧向人形机器人,加码投资的自然也不止英伟达一家巨头。上周OpenAI被曝已重启此前被放弃的机器人团队,新组建的机器人团队已经初步形成,并已经运作了大约两个月的时间。OpenAI副总裁、前机器人团队成员Peter Welinder表示,他们始终计划重返机器人领域,探索在高性能多模态模型驱动下,人形机器人能够取得的卓越成就。

来源:科创板日报


💡 重磅复活?OpenAI据称重启机器人项目 或再掀科技革新浪潮

据媒体报道,随着外界对人工智能驱动的机器人技术的投资升温,OpenAI正在重新启动公司先前抛弃的机器人技术团队。三位消息人士透露,该团队原本于2020年关闭,但公司当前正在招聘研究工程师来重建这一团队。OpenAI尚未发布关于公司在机器人技术方面的细节,只在最近的招聘信息提到,新员工将是“团队的首批成员”。一位知情人士称,该部门仅存在了大约两个月。过去一年,OpenAI通过内部的创业基金投资了几家公司,包括Figure AI、1X Technologies和Physical Intelligence。今年2月,OpenAI在Figure AI的筹款新闻稿中曾暗示,机器人技术可能会重新启动。一个月后,Figure发布了自己第一个OpenAI大模型加持的机器人演示视频。OpenAI副总裁Peter Welinder曾表示,“我们一直计划回到机器人技术领域,我们和Figure看到了一条道路,可以探索在功能强大的多模态模型加持下,人形机器人可以实现什么。”OpenAI打算与其注资的这些公司共存,而不是竞争,机器人制造商将把OpenAI的技术集成到他们自己系统中。OpenAI仍要于软件赛道中的公司展开竞争,其中就包括由前员工创办的Covariant等。目前尚不清楚OpenAI是否计划开发机器人硬件,几年前公司曾努力推进这一点。

来源:财联社


💡 “全球首创”单台 RTX 4090 服务器推理,昆仑万维开源 2 千亿稀疏大模型天工 MoE

昆仑万维今日宣布开源了2千亿稀疏大模型Skywork-MoE,这是基于之前开源的Skywork-13B模型中间checkpoint扩展而来的,被称是首个完整应用并落地MoE Upcycling技术的开源千亿MoE大模型,同时也是首个支持使用单台RTX 4090服务器推理的开源千亿MoE大模型。该模型隶属于天工3.0的研发模型系列,被称为中档大小模型(Skywork-MoE-Medium),总参数量为146B,激活参数量为22B,共有16个Expert,每个Expert大小为13B,每次激活其中的2个Expert。天工3.0还训练了75B(Skywork-MoE-Small)和400B(Skywork-MoE-Large)两档MoE模型,但不在此次开源之列。官方测试显示,在相同的激活参数量20B下,Skywork-MoE的能力接近70B的Dense模型,使得模型的推理成本有近3倍的下降。同时,Skywork-MoE的总参数大小比DeepSeekV2的总参数大小要小1/3,用更小的参数规模做到了相近的能力。Skywork-MoE的模型权重、技术报告完全开源,免费商用

来源:IT之家


💡 OpenCV 4.10.0 版本更新发布,首次支持 Windows ARM64、苹果 VisionOS

OpenCV 4.10.0 版本更新于昨日发布,包括对深度神经网络(DNN)模块的改进、实验性 NumPy 2.0 支持、Android 改进、NVIDIA CUDA 12.4+ 平台支持、RISC-V 和 ARM 改进、oneAPI 2024 支持、实验性 Windows ARM64 支持、实验性苹果 VisionOS 支持,以及 Linux 上的本机 Wayland 后端。此外,还首次支持 Windows ARM64 和苹果 VisionOS。OpenCV 4.10.0 更新内容涵盖了对 Core Module、Imgproc Module、Calib3d Module、DNN Module、G-API Module、Objdetect Module、VideoIO、Python Bindings 以及平台支持的多个改进和修复,具体包括对 cv::Mat 添加了 CV_FP16 数据类型,为 cv::remap 添加了相对位移场选项,修复了手眼校准方法中的错误,添加了对多个 TFLite 层的支持,优化了 RISC-V 扩展的 fastDepthwiseConv,为 DNN 模块中的 NaryEltwiseLayer 添加了 Vulkan 后端,添加了对现代 Yolo 检测器的支持,添加了 OpenVINO 2024 支持,为 V4L2 后端添加了 V4L2_PIX_FMT_SGRBG8 像素格式支持等。

来源:IT之家



标签:
评论 0
登录后即可发布评论
提交