苹果公司已向开发者推送iOS 18.4Beta3版本,新增对Apple Intelligence简体中文版的支持,并计划4月初正式上线,同时与iOS 18.4正式版同步发布。此举体现了苹果在个性化、本地化服务方面的战略升级,并与阿里巴巴合作以优化中国用户体验
广东省人民政府办公厅发布《推动人工智能与机器人产业创新发展的若干政策措施》,旨在促进技术进步与企业成长,共包含12项措施,涵盖技术攻关、企业培育、应用场景、产业集聚等方面。政策支持关键技术攻关和优质企业培育,对获得国家级单项冠军的企业提供最高300万元奖励。此外,还包括打造应用场景、推动产业集聚、支持重点项目建设、丰富数据要素供给、完善开源创新生态、引育人才、加强产业投融资、推进标准体系建设、打造
富士康于3月10日推出首款AI推理大模型“FoxBrain”,标志着台湾省在AI推理领域的重要进展。该模型基于Meta Llama3.1开发,具备数据处理、数学运算等关键功能,并计划开源以促进技术应用与合作。富士康此举为台湾省AI产业注入新活力,并致力于推动AI推理技术发展及广泛应用
科大讯飞宣布利用1万张910B国产算力卡成功进入大模型研发第一梯队,彰显其在算力资源优化及自主创新方面的领先地位。公司已成为唯一一家在国产平台上实现大模型训练与推理双重能力的企业,并正推进“星火X1”项目,旨在超越国际竞争者。此进展预示国产算力领域的重要突破
2025年3月10日,TrajectoryCrafter 技术的推出标志着视频编辑领域的一次重大突破。该技术利用扩散模型,实现了从单目视频推断并生成新视角的功能,为视频后期制作带来了全新的创作可能性,特别是其六自由度相机调整能力和生成复杂动态场景的能力。TrajectoryCrafter 有望改变短视频、影视后期及虚拟现实内容的制作方式
高通公司宣布收购Edge Impulse,以强化其在人工智能及物联网领域的技术实力,支持开发者并优化物联网战略。此举将推动高通提供全栈式解决方案,涵盖硬件、软件及服务,加速工业智能化进程
realme UI6.0系统更新引入DeepSeek-R1满血版,为六款真我手机提供智能助手升级,实现多轮交互、深度思考等功能,显著提升用户操作便捷性和使用体验
阿里巴巴旗下AI搜索引擎Accio用户量突破100万,强化对中小企业全球贸易的支持,展示市场对AI赋能工具的高需求
广州人工智能公共算力中心成功上线阿里通义千问的QwQ-32B开源推理模型,性能媲美顶级模型,显著优于同类产品,为开发者和企业提供高效自动化处理能力,助力产业升级和价值创造
研究人员开发了一款基于脑电图(EEG)分析的人工智能工具,能预测65岁以上女性数年内的大脑退化风险,为早期干预提供可能。该研究发表于《阿尔茨海默病杂志》,利用深度睡眠期间的脑波模式变化进行预测,已成功识别出85%的潜在认知障碍患者。此技术有望改变痴呆症的预防策略,但仍需进一步大规模研究以验证其有效性
在当前人工智能领域,AI大模型研究与应用备受瞩目,英伟达市盈率表现引发关注,预示行业增长潜力;国泰君安提出AI大模型将推动证券行业智能化;广州算力中心接入阿里通义千问大模型,科大讯飞自主研发算力卡取得突破。同时,全球范围内AI合作模式及产品开发成为焦点,北大TransPharmer模型为药物研发带来新途径,富士康推出台湾省首款AI推理大模型。AI大模型正影响多个行业,未来发展前景广阔
通义实验室开源R1-Omni模型,采用强化学习与可验证奖励(RLVR)方法,显著提升全模态情感识别任务推理和泛化性能。实验表明,该模型在多个测试集上显著优于基线模型,具备卓越的泛化能力和透明性。相关成果已发布于论文及开源平台
百度AI开源了PP-TableMagic,一款革命性的表格结构化信息提取解决方案,通过创新的多模型组网架构,实现了高精度端到端表格识别,并支持全场景定制化模型微调。该技术旨在克服传统表格识别在复杂场景下的局限,提升表格数据的自动化处理能力,并通过高性能推理、服务化部署满足多样化用户需求
人工智能公司DeepSeek澄清了关于其下一代R2模型将于3月17日发布的传闻,官方声明该消息为假。尽管有知情人士透露R2模型将在代码生成和多语言推理能力上实现显著提升,DeepSeek尚未公布具体的发布日期和技术细节
OpenAI推出响应API,旨在协助开发者构建自主任务的AI代理,并计划在2026年上半年停用现有助手API。该API支持自定义AI代理,使用gpt-40搜索模型,并引入开源工具包Agents SDK,以促进模型与内部系统的集成和优化。尽管存在局限性,OpenAI致力于缩小AI代理演示与实际产品间的差距,视代理为人工智能的关键应用
Meta正测试内部设计的人工智能训练芯片,与台积电合作生产,旨在减少对外部硬件供应商的依赖。此举是公司降低成本、优化AI工作负载战略的关键步骤,若测试成功,将有望显著影响其资本支出
江苏省苏州市常熟市人民法院宣判首例涉及AI生成内容的著作权纠纷案,确认AI生成图片的作者享有著作权。法院认定作品具有独创性,判决侵权方公开道歉并赔偿1万元,判决已生效
谷歌持有AI初创公司Anthropic 14%股份,逼近15%上限,但未获得投票权或董事会席位。公司已向Anthropic注资30亿美元,计划2025年追加7.5亿美元,展现科技巨头对AI领域的战略投资
在CVPR2025会议上,MIDI技术提出了一种革命性的方法,能够将单张2D图片转化为360度的3D场景。该技术通过智能分割图像元素,采用多实例同步扩散和多实例注意力机制,实现高效且真实的3D场景生成。MIDI具备快速处理、全局感知和强大泛化能力,有望在游戏开发、虚拟现实等领域引发变革
人工智能初创公司蝴蝶效应开发的通用智能体产品Manus与阿里云的通义千问模型达成战略合作,旨在国产模型和算力平台上实现Manus功能,共同推进创新智能体产品的研发
VideoPainter 是一款利用深度学习技术的视频编辑工具,能够通过提示词自动识别并编辑视频内容,显著提升长视频编辑的效率和便捷性。基于先进的DiT模型,该工具实现了高效的内容识别与修改,为视频创作提供了全新的可能性
本文概述了小红书上一种新兴的互动现象,即网友们通过BotGroup网页应用,在群聊中扮演AI公司的“霸道总裁”,指挥和控制AI模型进行各种职场模拟活动。该现象由Komorebi的创意引发,迅速获得广泛关注,展示了AI模型拟人化互动的趣味性和创新性,尽管平台功能尚显简陋,但已成为社交媒体上的热门趋势
Nanobrowser是一款免费开源的网页自动化工具,支持本地部署以确保数据安全,并兼容OpenAI、Anthropic(Claude)和Google(Gemini)三大主流AI模型。其直观的可视化操作界面和多重身份功能,使得用户能够轻松实现复杂的网页自动化任务,同时支持AI智能决策和上下文交流。项目持续开发中,计划增添更多高级功能
OpenAI 发布新工具 Responses API 和 Agents SDK,旨在简化 AI 开发流程并增强智能体功能。Responses API 提供实时信息搜索与引用,而 Agents SDK 协调多智能体工作流程。此外,新推出的计算机使用工具使 AI 能实际执行任务,预示 AI 智能体将从信息提供转向任务执行,对科技发展具有重大意义
AI智能体工具Manus与阿里通义千问达成战略合作,将推出中文版,旨在提升中文用户的AI应用体验。Manus由Monica.im孵化,因其创新功能受到关注,合作将加速产品本土化进程,为国内AI生态贡献力量
初创公司Dexterity完成9500万美元融资,估值为16.5亿美元,由Lightspeed Venture Partners和住友商事领投,凸显市场对AI机器人的强劲需求。该公司专注于开发能够执行重复性和危险任务的工业机器人,以满足物流和制造业需求,持续获得市场认可
阿里通义实验室开源多模态模型R1-Omni,采用强化学习与可验证奖励(RLVR)技术,显著提升音频和视频处理能力。该模型在情绪识别等任务中展现高透明度,性能在多个数据集上显著超越传统模型,为多模态任务研究提供新方向
Meta公司致力于研发自家AI训练芯片,以减少对外部供应商如Nvidia的依赖。该芯片由TSMC生产,针对AI工作负载设计,旨在提高技术自主性和降低成本
谷歌对人工智能初创公司Anthropic的投资总额已超30亿美元,持有14%股份,引发对其独立性的关注。同时,亚马逊亦承诺投资Anthropic 80亿美元,凸显大型科技企业对AI初创公司日益增强的影响力。监管机构正密切关注此类交易,以评估其对市场竞争的影响
生数科技任命清华大学自动化系博士骆怡航为CEO,负责公司全面运营。骆怡航具备丰富的云计算及AI领域经验,曾在字节跳动担任AI产品线负责人。生数科技以多模态技术领先,近期推出快速、低成本的AI视频生成模型Vidu2.0,骆怡航的加盟被视为AI视频商业化关键期的战略举措
超聚变公司与视联动力合作推出的FusionOne AI政法大模型一体机,为政法单位提供了高效、安全的办公解决方案。该一体机通过集成DeepSeek技术简化部署和操作,支持快速投入使用,并采用私有化部署及多重安全措施保障数据安全。此产品标志着超聚变在智能政法领域的进展,有助于推动政法工作数字化转型
Reka AI 推出开源推理模型 Reka Flash3,具备21亿参数,旨在平衡性能与效率,支持多种应用场景,包括对话、编码辅助和指令执行。该模型可处理最长32k令牌的上下文,适用于设备部署,且在多语言处理和实际应用中表现优异,为开发者提供了一种高效且灵活的AI解决方案
LLMs.txt生成器v2版本由@firecrawl_dev团队开发并推出,实现10倍速度提升,显著优化网站内容转换为AI可用的文本文件效率,扩展AI应用开发与训练领域应用潜力。此升级基于用户反馈和技术革新,为AI生态发展注入活力
Flower Labs 推出基于开放模型的混合云本地 AI 平台 Flower Intelligence,支持 AI 模型在本地与云端的无缝切换,确保数据安全性。Mozilla 已采用该技术,开发者可申请早期访问权限,平台计划添加更多高级功能。公司自成立以来筹集超2300万美元风险投资
Cerebras Systems 宣布在北美和欧洲新建六座数据中心,以增强其人工智能推理能力,主要集中在美国,预计2025年全面运营。数据中心将部署专为AI优化的晶圆规模引擎,提升处理速度。多家知名AI公司已签署合作协议,利用Cerebras平台的高速推理性能
中国人工智能公司DeepSeek官方辟谣了关于其下一代AI模型DeepSeek R2将于3月17日发布的传闻,强调该消息为假。市场对R2的期待引发了一系列未经证实的讨论,但DeepSeek尚未公布官方发布时间表,强调了信息准确性的重要性
Adobe近日推出“Customize”AI功能,升级Adobe Stock服务,允许用户直接在平台内快速编辑和优化库存图片,无需使用其他应用程序。该功能利用Adobe Firefly技术,增强用户创意控制,提供图像编辑和风格调整,现已对所有Adobe Stock用户开放,支持多种订阅计划
豆包大模型团队发布文生图技术报告,介绍了Seedream2.0图像生成模型,解决了文本渲染和对中国文化理解不足的问题,性能优于主流模型。报告展示了数据构建、预训练框架及后训练RLHF全流程的创新技术,模型在中文和英文生成上表现出色。团队致力于推动图像生成技术发展,并计划深入研究强化学习优化机制
北京硅基流动科技有限公司发生重大工商变更,引入包括美团在内的四家新投资方,注册资本增至约1512.4万人民币。该公司专注于生成式AI计算基础设施,其技术实力和商业价值得到市场认可
Anthropic公司CEO阿莫代预测,人工智能将在3至6个月内完成90%编程任务,并在12个月内实现几乎全部代码编写。他强调程序员的角色仍不可或缺,但AI将接管大部分重复性工作。同时,OpenAI的阿尔特曼认为,未来编程将采用自然语言,传统编码方式将逐渐被淘汰,预示编程领域即将迎来重大变革
在2025年,我国人形机器人领域取得显著进展,智元机器人发布具备高度智能交互功能的双足机器人灵犀X2。同时,预测未来五年全球人形机器人市场年增长率将超30%,我国市场有望达万亿元规模。人形机器人相关专利数量持续增长,2023年至2024年专利申请量分别激增276.47%和202.34%。专利类型以发明专利为主
Luma AI 开源新型图像模型预训练技术 Inductive Moment Matching (IMM),显著提升图像生成速度与质量,突破现有算法瓶颈,实现推理时的高效计算扩展。IMM 通过从推理效率角度优化预训练算法,大幅减少采样步骤,同时保持或提升图像质量,为多模态基础模型发展开辟新范式
最新报告显示,生成式人工智能交易市场预计将从2024年的2.453亿美元增至2034年的23.587亿美元,复合年增长率达25.4%。北美地区在2024年主导市场,市场份额达47.6%,金融数据生成领域领先。该技术显著提升交易效率,优化投资组合管理,助力金融机构风险管理
蚂蚁医疗团队研发的医疗大模型在MedBench评测中荣获双料冠军,评分高达97.5和98.2分,凸显了其在医疗推理模型领域的领先地位。该模型采用强化学习技术,实现多模态交互,显著提升了医疗服务智能化水平,标志着中国医疗AI技术的发展和行业智能化进程的加速
OpenAI 发布了一款新的人工智能模型,其在创意写作领域表现出显著优势,能够生成具有深度的元小说作品。此模型的出现标志着AI在情感与创作深度上的重要进展,预示着人工智能在文艺创作领域的广泛应用前景
谷歌发布Gemma3 AI模型,宣称其为全球性能最强的单加速器模型,显著提升性能,尤其适用于单显卡开发者。Gemma3支持多语言,擅长多媒体处理,并在单GPU性能上超越竞品。新模型引入内容安全功能,并针对潜在误用风险进行评估。尽管开放性受争议,Gemma3的发布仍标志着谷歌在AI领域的显著进展
SiliconCloud平台推出DeepSeek-R1和V3API的批量推理功能,允许用户通过批量API进行大规模数据处理,同时大幅降低批量推理价格,提供更高效、成本更低的服务。特别优惠期间,DeepSeek-R1批量推理价格降低75%,适用于非实时数据处理任务
硅基流动宣布其SiliconCloud平台支持DeepSeek-R1和V3 API的批量推理功能,提供高效、低成本的数据处理解决方案,特别优惠期间价格大幅降低,适用于非实时数据分析场景
马来西亚电信巨头 Maxis 与华为技术(马来西亚)达成战略合作,携手利用人工智能与机器学习技术优化网络运营,加速数字化转型,提升用户体验及运营效率。合作将聚焦于智能化网络管理,通过自动化减少手动操作,旨在推动马来西亚通信行业向高效智能的未来发展
腾讯元宝电脑版1.3.0版本更新显著提升功能性与用户体验,引入大字体设置以优化阅读体验,新增拖拽上传功能简化操作流程,并支持腾讯混元及DeepSeek两大模型,实现高效智能任务处理
西班牙政府颁布新法案,针对未标注AI生成内容的行为,将对相关公司施加重罚,最高罚款可达3500万欧元或公司全球年营业额的7%。该法案旨在增强AI透明度,防范“深度伪造”风险,并设立监管机构负责执行,同时禁止利用AI潜意识技术影响弱势群体。法案尚待下议院批准
Meta面临高昂的AI基础设施成本,计划通过自研AI芯片降低支出,预计年度总支出可达1190亿美元。该公司已取得显著进展,计划2026年开始使用自研芯片,旨在减少对英伟达GPU的依赖,并提高能效比以降低能耗。台积电将负责生产,但芯片性能达标仍存在不确定性
腾讯元宝电脑版1.3.0版本更新,新增大字体支持和拖拽上传功能,显著优化用户体验。同时,元宝在App Store免费应用下载排行榜上位居首位,彰显产品竞争力和腾讯在AI技术领域的创新实力
谷歌宣布开源多模态大模型Gemma-3,具备10亿至270亿参数,显著降低算力需求。该模型采用创新架构,优化长上下文处理和多模态数据处理能力,支持140种语言,多项任务表现优异,展现综合实力
理想汽车发布理想同学网页版,拓展智能服务生态,实现电脑端使用;接入DeepSeek R1V3671B满血版,增强问答能力,支持多场景协同与深度思考功能;具备千字长文本输入、传图问答及多端历史对话同步,提升用户体验。此版本还引入形象交互功能,预示理想汽车将持续探索智能服务新领域
字节跳动推出的AI原生集成开发环境Trae已接入硅基流动平台,提供多种编码模型,简化开发流程,增强编程效率。用户可通过简易步骤获取API密钥,并添加所需模型。硅基流动持续扩展模型及合作应用,致力于稳定API服务
ManusAI公司于3月12日宣布,其推出的全球首款通用型AI Agent Manus在短时间内吸引了200万人加入使用等候名单,引发广泛关注。该产品由90后中国团队打造,以其独特功能和用户狂热追捧成为科技界热点,但其市场策略亦引发讨论。未来Manus的表现值得行业持续关注
NVIDIA 与国际组织合作,运用人工智能技术助力野生动物保护,通过 EarthRanger 平台等工具提高保护效率。该技术能够预测动物行为,实时监测濒危物种,并支持野火监测,为生物多样性保护提供创新解决方案。NVIDIA 将在即将举办的全球 AI 大会上分享最新成果,推动环境保护技术的发展
中国科学技术大学孙成研究组与合作伙伴开发出“TIMES”评分系统,这是一种结合空间免疫信息的肝癌复发预测工具,已转化为在线AI诊断平台。该成果发表在《自然》期刊,标志着肿瘤微环境评估的新方法,有助于优化治疗方案,提高患者预后
本研究简报聚焦于德国BAM与柏林自由大学团队开发的FIORA,一种开源图神经网络模型,用于提升非靶向代谢组学中质谱化合物鉴定的准确性。该模型通过模拟质谱碎裂过程,学习化合物的断裂模式,显著提高了质量预测及其他特征如保留时间和碰撞截面的准确性。发表于《Nature Communications》的成果,对推动未知化合物分析领域的研究具有重大意义,展现了在质谱分析技术上的重要进展
Insilico Medicine完成1.1亿美元E轮融资,Value Partners领投,资金将用于AI模型完善及特发性肺纤维化药物临床试验。公司小分子抑制剂rentosertib在2a期临床试验中显示积极结果,同时启动间皮瘤等实体肿瘤分子药物ISM6331的患者注射。Insilico致力于加速药物研发和AI平台发展,巩固其在医疗创新领域的领导地位
谷歌推出Gemini2.0Flash,一款集成原生图像生成功能的AI模型,显著提升图像生成效率和准确性。该模型支持文字图像“讲故事”、实时图像编辑、知识丰富的图像生成和清晰的文本渲染。Gemini2.0Flash旨在满足个人用户和企业的创意需求,为营销设计、开发工具和效率软件带来新助力。开发者可通过Gemini API体验此功能,预示着AI创作新时代的到来
清华大学研究团队开发的新型APB序列并行推理框架,显著提升了大型模型处理超长文本的速度,实现速度比肩Flash Attention的10倍。该技术通过序列并行和稀疏注意力机制的巧妙结合,有效解决了传统Transformer架构在处理长文本时的速度瓶颈问题,不仅提升了响应速度,还保持了高性能。APB框架的推出,有望推动AI应用进入一个更快、更强、更智能的新时代。相关成果已开源并发布论文
Remade AI于3月12日在Hugging Face平台发布8款基于Wan2.1模型的开源特效LoRA,为AI视频生成带来创新可能性。这些特效LoRA将图像转化为动态视频,推动AI技术民主化,并获社交媒体广泛赞誉。业内专家认为此举将降低创作门槛,加速AI视频应用普及,预示着AI视频生成领域的新一轮革新热潮
Netflix 游戏部门副总裁迈克・维尔杜宣布离职,引发对其负责的生成式人工智能战略实施疑虑。维尔杜未能明确阐述该技术在软件开发中的应用,其离职可能影响游戏业务推进,Netflix 生成式人工智能未来发展前景未定
人工智能公司Nous Research推出全新模型推理API,提供基于Meta Llama3.1架构的通用模型Hermes3Llama70B和推理模型DeepHermes-38B Preview。该API旨在将Nous Research的“个性化、无限制”语言模型通过程序化接口开放给更广泛的开发者及研究人员,同时采用先到先得的候补名单系统和免费额度吸引用户。此举标志着Nous Research在坚
字节跳动推出革命性AI音效生成模型SeedFoley,通过端到端架构和视频编码器,实现音效与视频内容的高度同步和完美匹配。该模型能处理不同长度的视频输入,生成专业级音效,提升视频叙事张力和情感传递效率。SeedFoley已集成至字节跳动旗下视频创作平台即梦,为用户便捷制作高质量视频提供支持
阿里通义Wan团队推出了一款革命性的All-in-One视频生成和编辑模型——VACE,具备按条件生成视频、物体运动轨迹控制、视频主体替换、风格迁移、画面扩展和动态化等功能,显著提升视频创作的效率和创意实现。VACE模型将开源,预将引发视频内容创作领域的重大变革
Mirokaï,一款由Jérôme Monceaux打造的创新机器人,以其独特的“外星人”设定和高度仿真的3D面部表情在市场上脱颖而出。该机器人以3万美元的售价,连续两年在CES展上获得“最受欢迎”奖项,展现了其强大的吸引力和市场潜力。Mirokaï不仅外观设计独特,还具备实用功能,如辅助医疗工作,体现了机器人的实用化和人性化发展方向
谷歌DeepMind发布Gemini Robotics,一款基于Gemini2.0模型的先进机器人系统,具备强大的物理世界理解与操作能力。该系统在综合泛化基准测试中性能领先,能理解复杂指令并执行精细动作,具备多形态适应性,同时注重安全性与伦理标准。Gemini Robotics-ER版本进一步提升了空间理解能力,预示着智能机器人时代的到来
百度文心快码发布Comate Zulu版本并启动公测,标志着其在智能编程领域的重大进展。该版本通过全自然语言需求理解、业务逻辑快速掌握及自动环境搭建等功能,显著提升编程效率和智能化水平,支持主流IDE,开放至3月28日的公测供开发者体验
ServiceNow 宣布以28.5亿美元收购 Moveworks,以强化其AI战略。Moveworks,专注于利用语言模型提升企业聊天机器人性能,已服务于多家大型企业。此次收购预计将推动企业级AI的广泛应用,优化用户体验
杭州斗兽场数字智能技术公司(LynxAI)近日获得数百万人民币天使轮投资,专注于为跨境电商企业提供Agentic AI产品平台。本轮融资将用于产品创新模型研发及团队扩张,以提升市场竞争力
阿里巴巴推出AI旗舰应用新夸克,整合AI对话、深度搜索等多功能,打造无边界的“AI超级框”,标志着公司在AI应用领域的重大突破,旨在为用户提供便捷、高效、智能的全新体验
阿里巴巴推出AI旗舰应用新夸克,集成阿里通义大模型,升级为“AI超级框”,为用户提供一站式AI服务,包括搜索、写作、图像生成等,旨在革新信息获取与问题解决方式,引领AI应用新趋势
卡内基梅隆大学与HuggingFace合作开发的“元强化微调”(MRT)方法,旨在提高大语言模型在复杂推理任务中的计算效率。研究显示,MRT微调后的模型在推理基准测试中性能显著提升,准确率是传统方法的2至3倍,同时提高了token使用效率。该成果为优化大语言模型推理能力提供了新方向,并有望降低计算资源消耗
Open-Sora2.0,一款全新开源视频生成模型,以仅20万美元的成本训练成功,性能直逼百万美元级商业模型。该模型具备卓越的视频生成能力,实现了高清、流畅、多样化的视频输出,并在VBench评测中表现出色。Open-Sora2.0的开源发布,标志着视频生成技术的普及化,降低了创作门槛,为AI视频创作带来了革命性变革。开源社区携手共建,推动AI视频技术向更开放、普惠的方向发展
珠海华发集团宣布向国内AI大模型企业智谱进行5亿元战略投资,以推动其技术进步与生态发展,标志着珠海国资正式加入智谱投资阵容。智谱作为行业领先企业,已获得多轮大规模融资,计划在2025年开源全新大模型,助力AI产业发展。此合作将促进珠海AI产业生态建设,共同推动AI行业繁荣
阿里巴巴发布AI旗舰应用“新夸克”,基于先进的推理及多模态大模型,旨在升级为无边界的“AI超级框”,实现实时互动与多场景应用,满足用户多样化的AI需求,并计划将最新AI技术成果及时集成,推进AI成为个人超级全能助手
潞晨科技推出开源视频生成模型Open-Sora2.0,以20万美元训练成本实现110亿参数的商业级视频生成大模型,性能直追OpenAI Sora。该模型在VBench评测中与OpenAI Sora性能差距缩小至0.69%,在用户偏好评测中超越多个开源和商业模型。Open-Sora2.0采用3D自编码器和Flow Matching训练框架,引入3D全注意力机制,通过优化数据筛选、训练策略和并行训练方
Luma公司开源图像模型预训练技术IMM,实现生成式AI领域重要突破,显著提升采样效率和样本质量,优于传统扩散模型和一致性模型。IMM技术在ImageNet和CIFAR-10数据集上表现卓越,预示图像生成技术可能迎来范式转变。Luma此举推动AI研究开放性,有望在多模态领域引发更广泛讨论
腾讯宣布智能助手腾讯元宝与腾讯文档深度整合,优化用户办公协作效率,实现一键上传和导出多种文档格式,简化办公流程,提升协作体验。此功能已率先在手机端和Web端上线,电脑版即将推出
人工智能初创公司鹿影科技(Avolution.ai)据悉将被MiniMax收购,双方已达成初步意向。鹿影科技专注于AI视频生成创作平台,曾获天使轮投资,其技术积累成为与MiniMax合作的基础
英矽智能宣布完成1.1亿美元E轮融资,由惠理集团等领投,资金将主要用于人工智能平台升级和药物研发,特别是针对特发性肺纤维化的治疗药物。本轮融资体现了资本市场对该公司在生物医药领域创新能力的认可
英国首相基尔・斯塔默提出以数字化和人工智能提高政府工作效率的计划,预期节省开支450亿英镑,并招募2000名技术学徒。该计划引发工会关注,担忧岗位流失,强调改革需在合作中进行。斯塔默同时提议减少监管和精简非政府组织以提升效率
YOLOE模型的推出标志着AI视觉识别技术的重大突破,实现了无需预设类别标签的实时物体识别。该模型通过三大创新模块,能理解和转换文本指令,分析模糊图像,并在无提示情况下自主识别物体,显著提升了AI的视觉感知能力。YOLOE不仅在性能上超越了现有技术,还融合了多任务处理能力,展现了广泛的应用潜力,预示着AI视觉技术的开放世界新纪元
阶跃星辰研究团队通过大规模实验,揭示了在大语言模型训练中普遍适用的“Step Law”缩放规律,指出最优学习率和批量大小与模型及数据规模存在幂律关系。该研究首次全面探讨了不同形状、稀疏度和数据分布下超参数的稳定性,并提出了一种高效的最优超参数估算工具。实验表明,该规律具有广泛的适用性,且提出的优化策略对提高训练效率和稳定性具有重要意义。团队计划开源实验细节,以推动AI领域的进一步研究和技术发展
北京市教委计划在中小学打造首批11个人工智能应用场景,并培育7个“京娃”智能体,以人工智能技术支持教育培养体系,促进学生的个性化发展。该计划涵盖教学、学习、身心健康、综合素质评价等多个方面,旨在防范过度依赖和隐私风险,并已在多所学校开展试点
调查概览:美国埃隆大学研究表明,52%的美国成年人使用AI大语言模型,其中ChatGPT使用率最高。近四成用户认为AI可建立深厚人际关系,但多数受访者对AI可能减少人际交流和工作机会表示担忧
Flower Labs推出Flower Intelligence分布式云平台,创新地结合本地与云端AI模型部署,强化隐私保护并提高灵活性。该平台获Y Combinator支持,并与Mozilla合作,标志着AI应用向更开放、隐私保护的方向发展
人工智能技术正在重塑内容创作行业,AI视频编辑平台OpusClip获得软银愿景基金2号2000万美元融资,标志着内容创作与分发规则的重写。OpusClip利用AI技术优化视频内容制作,扩大服务范围,并推出OpusSearch产品,助力创作者高效利用内容资源。此投资凸显市场对AI在内容创作转型中角色的信心,预示着未来内容创作将更加民主化和高效
西湖大学研究团队成功开发出一种无监督算法的AI文本检测模型,可准确识别文本是否由人工智能创作。该模型旨在应对AI生成文本中的“AI幻觉”问题,并提升检测的准确性与适应性,对维护学术诚信和信息真实性具有重要意义
上海阶跃星辰智能科技有限公司与智元机器人达成深度战略合作,聚焦基座大模型和具身机器人技术,旨在推动家庭服务、新零售等领域的智能化应用,实现技术突破与产业升级
优必选科技与北京人形机器人创新中心联合发布全尺寸科研教育人形机器人“天工行者”,定价29.9万元,显著低于市场同类产品,推动科技平民化。该机器人具备高自由度、强大算力及开放接口,支持二次开发,助力科研教育领域创新。优必选设立1000万元科研共研共创基金,加速人形机器人技术普及与应用