通义实验室自然语言智能团队发布开源多模态RAG推理框架VRAG-RL,针对视觉文档中的关键信息检索与推理难题进行创新。该框架通过强化学习、视觉感知机制设计及检索推理协同优化,有效提升AI在处理复杂视觉信息时的性能。实验显示,VRAG-RL在多个视觉语言基准数据集上表现出显著优势
亚利桑那州立大学研究团队在arXiv平台发表论文,指出当前对大型语言模型的理解存在误区,强调AI模型并非进行真正的思考或推理,而是寻找数据相关性。研究提醒公众应谨慎看待AI技术的能力,避免对其产生误导性信心,并预示未来研究将朝向更具解释性的方向发展
Perplexity AI推出Perplexity Labs,为Pro订阅用户提供了集成了深度网络浏览、代码执行、图表生成等功能的AI生产力工具,将创意实现流程缩短至数分钟。该平台标志着Perplexity从答案引擎向综合性AI生产平台的转变,显著提升知识工作者的效率,并可能推动AI工具向更综合性的平台演进
夸克推出基于通义千问大模型的“深度研究”功能,实现从资料搜集至报告生成的全流程自动化研究,支持多种应用场景。此更新标志着AI在生成式内容创作领域的显著进步,并预示未来将进一步拓展功能和应用范围
人工智能能耗分析显示,预计到2025年底,其电力消耗将占全球数据中心总消耗近半,目前已达五分之一。尽管技术效率提升,人工智能电力需求仍快速增长,凸显了其在能源管理及可持续发展方面的挑战
华为成功研发“昇腾 + Pangu Ultra MoE”系统,实现无需GPU即可快速处理大规模MoE模型,展示其在国产算力和模型训练领域的强大实力。通过技术创新提升训练效率和单节点算力,华为为大规模AI模型训练和应用开辟新路径
元宝与腾讯地图成功对接,优化了地点搜索与导航服务,提升用户体验。双方合作实现了快速准确的推荐与一键导航功能,拓宽了智能助手在日常生活和工作场景的应用
研究人员开发出一款基于人工智能的新工具,能够预测哪些前列腺癌患者将受益于药物阿比特龙,该药物已证明能显著降低晚期前列腺癌患者的死亡风险。该 AI 测试识别出特定患者群体,使医疗系统能够更精准地提供个性化治疗方案,避免过度治疗。研究结果显示,对于生物标志物阳性的患者,阿比特龙能显著降低五年内死亡风险。此研究有望推动阿比特龙在英国等国家对高风险前列腺癌患者的使用
OpenAI 向法院申请继续对特斯拉创始人马斯克进行反诉,坚称马斯克请求驳回反诉缺乏事实依据。此案件涉及马斯克对OpenAI转型营利模式的指控,以及OpenAI对马斯克涉嫌欺诈行为的反诉。双方法律争斗持续,审理结果将显著影响双方企业形象
人形机器人公司Figure宣布完成史上最大规模的组织重组,将三个独立技术团队整合为AI核心小组Helix,以加速人形机器人商业化进程。此次重组旨在打破技术壁垒,提升研发效率,强化AI能力,并标志着公司从机器人制造商向AI驱动智能机器人公司的战略转型。CEO强调Figure的核心是一家AI公司,重组效果将影响其在激烈市场竞争中的地位
阿里云正式推出通义灵码 AI IDE,一款具备智能编程功能的人工智能开发环境,支持高效编码体验,已广泛应用于多家企业,标志着其在智能编程领域的重大进展
Runway公司推出Gen-4References移动端功能,利用AI技术将用户手机照片转化为风格一致的艺术作品,实现便捷创作。该功能支持人物、场景风格一致性,并保留细节,为社交媒体和创意项目提供新视角。此举标志着移动端AI创作的重大进步,预示着未来创作模式的变革
Perplexity公司推出全新“实验室”功能,标志着其从搜索工具向综合性AI平台转型,以应对市场竞争。该功能支持超长运行时间、多功能集成和多样化输出,提升用户体验,并旨在将Perplexity定位为全面的AI工作平台。此更新面向专业版用户,旨在扩大用户基础并增加收入
Anthropic公司近日开源了“电路追踪”工具,该工具通过生成归因图揭示了大型语言模型内部的决策过程,增强了对AI决策机制的理解,并为透明化、可控的AI发展提供了重要支持。此技术不仅有助于优化模型性能,还助力解决AI的伦理与安全挑战,标志着AI可解释性领域的重要进展
AI初创公司Manus推出Manus Slides,一种基于AI的幻灯片生成工具,可自动创建结构化演示文稿。该功能简化了文稿创作过程,支持快速编辑和格式导出,适用于商务、教育和创意等多个领域,提高了专业人士的工作效率,标志着AI代理在生产工具领域的进步
特拉华州检察长聘请投资银行对 OpenAI 营利性转型计划进行独立评估,可能影响公司转型进程及监管审批。OpenAI 需克服监管挑战以吸引投资并实现上市,同时,Elon Musk 的收购要约可能推高非营利组织估值
Anthropic公司CEO达里奥·阿莫代伊警告,AI技术快速发展可能导致未来五年内一半入门级白领工作被淘汰,失业率或升至10%-20%。他指出,社会需提高对AI的认识和素养,以应对潜在的经济不平等和职业转型挑战。同时,他强调政策制定者应重视AI对经济的影响,并探索相应政策解决方案
Midjourney宣布三项关键更新,包括V7版本渲染速度提升40%,AI版主功能升级,以及启动第二轮社区路线图投票,以增强用户体验和社区参与度,凸显其在AI图像生成领域的领先地位及创新力
Anthropic公司宣布其旗舰AI模型Claude新增支持开发者构建直接交互的应用程序,与AI Studio开发理念高度契合,为开发者提供广阔创新空间。此更新标志着Claude向应用开发平台迈进,有望推动AI Studio成为AI应用开发枢纽,加速AI应用的普及与落地
Memvid,一款创新的AI记忆工具,通过视频格式编码文本数据,实现亚秒级快速语义搜索,显著提升AI记忆管理效率。其压缩存储和离线使用特性,以及支持自然语言搜索和直接对话功能,使其在学术研究、知识管理和教育领域具有广泛应用潜力。Memvid的出现标志着AI记忆技术的重要进展
研究揭示,黑客正利用假冒的开放源代码组件和伪装的人工智能框架,通过供应链攻击窃取信息。近期,三个假冒阿里云AI实验室SDK的恶意软件包在PyPI被发现,利用Pickle格式存储恶意ML模型窃取用户数据。此攻击凸显了当前安全工具在检测恶意ML模型方面的不足,对开发者构成安全隐患
Salesforce 宣布以80亿美元收购数据管理公司 Informatica,旨在强化数据处理和人工智能能力,以应对市场竞争和满足企业智能化需求,同时加速其AI战略实施。该交易体现了 Salesforce 在科技环境中的战略决策智慧,有望为公司带来新的增长机会
近日,夸克健康大模型在12门国家副主任医师职称考试中均超过合格线,成为国内首个通过此专业门槛的AI大模型,标志着AI在医疗专业能力上的重大突破。该模型基于阿里巴巴通义千问技术,通过海量数据和多阶段训练实现高准确率诊断,为医疗健康领域提供了智能化辅助工具
SlidesOrator 项目在BEYOND Expo展会亮相,以其创新的PPT自动演讲功能吸引关注。该工具利用AI技术,自动生成语音解说并驱动3D虚拟数字人演示,实现高效且互动的演讲体验。其优化了多语言语音合成等技术,适用于教育培训、企业宣讲等领域,尤其受发展中地区用户欢迎,标志着职场演讲新趋势的出现
摘要:百度推出全新智能体协作应用——心响,现已在iOS平台上线,安卓用户亦可免费使用。该应用具有低使用门槛,无需邀请码,支持用户在多个场景下获取智能体服务,包括旅游规划、深度研究、法律咨询等。心响能根据用户需求自动生成专业攻略和研究报告,同时提供类似线下医生咨询的健康咨询服务。应用的智能化协作能力,旨在提升用户日常生活的便捷性和信息获取的效率
夸克健康大模型在我国副主任医师职称考试中取得显著成果,首次通过12门学科评测,并在4个学科达到主任医师及格线,标志着大模型在医疗领域实现关键性进步,为医疗辅助决策提供了强大支持
本文摘要:针对高考志愿填报的搜索需求,夸克搜索推出行业首个“深度搜索”能力,助力考生和家长精准定位志愿方案。该功能结合自建高考知识库,提供动态智能检索和多轮校验,确保数据权威准确,并降低大模型幻觉率,提高回答内容的正确性。夸克已连续七年免费提供高考志愿填报服务,包括模拟选志愿功能和高考深度搜索,以帮助用户规避风险,优化志愿选择
Chrome v137开发者工具更新引入Gemini AI智能助手,显著提升性能分析和调试效率,实现智能标注、AI驱动CSS调试及性能优化洞察,进一步优化开发者工作流程和体验
阿联酋将与OpenAI合作,成为首个向全体居民免费提供ChatGPT Plus服务的国家,标志着人工智能普及化的重要进展。该合作包括在阿布扎比建设大型AI数据中心,并致力于将AI技术广泛应用于多个领域,同时推动本土化解决方案的开发。此项目投资总额可能达200亿美元,展现了对AI技术未来发展的重大承诺
江苏苏州成功设立60亿元人工智能产业专项母基金,旨在促进人工智能与制造业等行业的深度融合。基金聚焦算力基础设施、数据、人才等关键领域投资,由多家机构共同出资,预计将推动苏州工业园区人工智能产业发展,到2024年企业数量将达到1800家以上
法国Kyutai实验室推出革命性语音AI系统Unmute,通过模块化设计赋予文本大语言模型强大的语音交互能力,实现智能对话、低延迟交互和个性化声音定制。Unmute的发布标志着语音AI技术的新进展,为开发者提供了高效解决方案,并即将开源以推动全球技术创新
OpenAI 宣布在韩国成立法律实体,计划在首尔开设办公室,并与当地企业如 Kakao、SK Telecom 建立合作关系,以深化在全球最具技术实力国家之一的 AI 生态系统参与。韩国市场对 ChatGPT 的付费用户数量位居全球第二,展现了对 AI 技术的高度采纳
UAV-Flow项目通过自然语言处理技术,实现了用户仅凭语音指令控制无人机的突破性进展。该项目利用先进的语音识别和指令解析算法,简化了无人机操作流程,为消费、工业和救援等领域带来广泛的应用前景。尽管面临技术落地和法规挑战,UAV-Flow有望成为无人机行业的新标准,推动人机交互方式的革新
OpenAI 发布了HealthBench数据集,用于评估大型语言模型在医疗健康领域的回答能力,获得专家高度评价,标志着OpenAI在医疗健康领域的独立探索,旨在推动医疗AI技术的安全性和可靠性
Anthropic 旗下AI模型Claude计划进行重大功能升级,包括扩展上下文窗口至百万字符、增强记忆功能、提升输出能力、支持多文件格式、优化工具调用及改进视觉功能。这些改进旨在提升模型处理复杂任务的能力,并在多模态任务和企业级应用中取得领先地位,预示着Claude将向更智能、通用的AI助手方向发展
OpenAI 旗下 GPT-4o 的高级语音模式经过更新,新增了唱歌功能,提升了多模态交互的自然度和情感表达。尽管唱歌功能尚需优化,但此更新标志着 AI 在音频生成和交互领域的进步,为未来应用提供了新可能性
广汽集团成功申请智能座舱AI计算装置专利,提升车辆AI计算能力,旨在优化用户体验。该技术以AI芯片为核心,集成连接、电源、存储模块, enabling 算力扩展,计划应用于量产车型,推动汽车智能化进程
红帽公司携手行业巨头启动开源项目llm-d,旨在满足生成式AI大规模推理需求,提升企业IT基础设施的推理能力,降低成本。此项目反映了市场对推理技术战略重要性的认识,以及应对大规模推理资源需求的挑战。通过开源合作,llm-d有望推动AI推理技术的标准化和普及化
Anthropic公司推出的Claude4系列大模型,包括Claude Opus4和Claude Sonnet4,已在Amazon Bedrock平台上上线,标志着智能代理AI向企业级应用迈进。这些模型具有强大的多步骤推理、工具使用和任务完成能力,特别适用于高复杂度企业场景。Claude Opus4在行业标准测试中表现出色,开发者可通过Amazon Bedrock API访问,实现高效的任务执行和
360宣布全面升级旗下浏览器为AI浏览器,赋予4亿用户AI智能协作能力,实现搜索、阅读、写作的一体化操作。新浏览器围绕搜索、阅读与助手三大场景推出原生智能功能,包括智能搜索、常驻智能助手、AI阅读与写作支持。此次升级标志着360在AI领域的重要布局,旨在构建更高效、可信的智能上网体验
星门计划(Project Stargate)是一项由OpenAI、Oracle、SoftBank和阿布扎比MGX基金共同推动的5000亿美元AI数据中心项目,旨在重塑全球AI计算格局。该计划已在美国阿比林和阿布扎比分别启动1.2吉瓦和5吉瓦的超级数据中心建设,预计将为AI领域提供强大的算力支持,加速科技发展。项目得到了强大的技术与资金支持,展现了跨国合作在推动全球AI基础设施发展中的重要作用。同时
Youware最新更新深度集成Model Context Protocol(MCP),实现智能化网页一键生成,显著提升建站效率与体验。更新解决了素材挑选与上传难题,引入积分系统和社区功能,增强用户互动和创作激励。此更新标志着AI建站在智能化和社区化方面迈出重要步伐
阿里妈妈在首届国际通用人工智能大会TongAI上推出了URM通用召回大模型,该模型在生成式推荐领域实现了突破,旨在通过深度学习和大数据分析提升广告投放精准度,优化消费者购物体验,并助力商家制定更有效的投放策略,推动电商行业智能化转型
AI日报摘要】 昆仑万维推出全球首款基于AI Agent架构的Office智能体APP,提高移动办公效率;研究表明ChatGPT可显著提升学生学习成效;谷歌扩展Veo3访问权限,发布MedGemma、SignGemma和DolphinGemma三款AI模型;VideoTutor创新AI教育工具,一键生成定制教学视频;字节跳动开源多模态模型BAGEL,提升图像理解和生成能力;Rork无代码开发工具简
优必选科技联合中国电信陕西公司及数字生活公司发布首款家庭桌面AI机器人,集成了情感计算、环境感知等先进技术,提供拟人化陪伴及多样化家庭服务。该产品基于中国电信星辰大模型,旨在推动智能家居市场发展,并计划在陕西地区销售不低于10万台
FinRobot,一款开源AI金融分析工具,正引领金融行业智能化变革。其多智能体协作系统与多模态数据处理能力,为交易预测、投资组合优化、报告生成及风险预警提供强大支持。FinRobot高度定制化,满足多样化金融需求,通过自动化赋能,提升工作效率,并在市场预测、投资组合优化和风险评估等多场景下展现其应用价值。该工具的开源特性推动了金融AI的创新,为行业带来了新的发展机遇
华硕与越南市场建设公司Digiworld签署谅解备忘录,共同推进越南人工智能生态系统发展,旨在加速该国社会经济发展及高科技领域进步。双方将整合AI及下一代技术,推出多样化AI硬件与软件解决方案,助力企业和政府智能化转型。华硕凭借其在硬件、软件及数据中心建设方面的实力,以及高性能AI服务器产品,与Digiworld共同推动越南AI产业发展
微软在Windows11操作系统中引入了生成式AI功能,包括画图应用的贴纸生成器、截图工具的“完美截图”功能以及记事本的AI写作辅助。这些功能正在Windows Insider用户中进行测试,部分功能需支持Copilot的电脑。微软CEO强调,这些创新预示着科技行业正经历新一轮平台转型
豆包官方推出实时视频通话功能,升级交互体验,支持基于视觉推理模型的深度思考和创作,用户可通过最新版App轻松实现视频对话
调查报告显示,大学生在论文写作中使用 AI 技术的现象普遍,引发教师关注。多数教师认可 AI 的辅助作用,但同时指出需规范使用以避免学生过度依赖。近半数教师认为学生过度依赖 AI,且有超四成教师支持取消传统毕业论文考核,主张构建多元化的评价体系以适应教育发展需求
俄勒冈州希尔斯伯勒X公司数据中心发生电池引发火灾,消防部门迅速响应控制火势,无人员伤亡。火灾原因调查中,事件引发数据中心安全管理关注
苹果公司计划在2025年WWDC上向第三方开发者开放设备内AI模型,推出SDK以促进智能应用程序开发,增强iPhone和Mac的智能功能。此举旨在激发创新,提升产品竞争力,同时苹果正对软件进行重大重新设计,以实现系统外观和感觉的统一。开发者或将获得新工具以通过Siri构建语音驱动功能,预计相关更新将在未来iOS版本中推出
在Google I/O大会上,Google推出了创新的3D视频通信平台——Google Beam,利用人工智能技术实现身临其境的沟通体验。该平台通过六台摄像头阵列和AI体视视频模型,实现逼真的3D效果,并支持实时语音翻译功能,打破语言壁垒。Google Beam定位于高端企业市场,与HP等企业合作,计划向全球企业客户交付设备,展现其在远程协作领域的巨大潜力
美国众议院以微弱优势通过了《HR1》法案,禁止各州在未来十年内监管人工智能,此举为科技巨头带来利好,同时引发对消费者保护及弱势群体权益的担忧。法案将为政府业务系统升级及AI技术发展提供5亿美元资金支持
戴尔推出集成英特尔Gaudi3AI加速器的全新AI平台,旨在简化企业AI技术的采纳与扩展。该平台结合了Gaudi3硬件性能、开源软件灵活性与戴尔的企业基础设施经验,提供端到端解决方案,优化AI应用部署,实现成本效益与性能的平衡。平台的核心为优化过的PowerEdge XE9680服务器,配备高效计算能力与预验证开源软件栈,支持多种框架,提供灵活资源调度。戴尔Omnia工具进一步增强了资源动态分配能
AI高考通”——QQ浏览器推出的首个高考Agent,采用AI技术为高考生提供全流程支持,包括解题答疑、作文辅导、高考日程查询、个性化志愿填报方案等。该工具整合大量院校及专业信息,基于腾讯混元大模型技术,为考生提供定制化志愿建议,助力考生高效获取权威高考信息
饿了么推出一系列基于人工智能技术的产品工具,以提升商家经营效率,简化流程。这些工具涵盖了从店铺入驻到日常经营的各个环节,包括AI店铺助手、智能店装、智能发品、智能选品托管、智能美图、经营诊断和营销智投等。AI店铺助手以自然语言对话式服务简化入驻流程,智能店装和智能发品加速店铺准备,智能选品托管优化菜品展示,智能美图美化菜品图像,经营诊断和营销智投提升日常经营效果。饿了么的智能化体系持续迭代,旨在长
在Microsoft Build开发者大会上,微软推出开源项目Magentic-UI,一款以人为中心的人工智能网页代理系统。该系统通过智能自动化处理复杂网页任务,同时确保用户控制权,强调透明度和安全性。Magentic-UI支持任务学习功能,采用多智能体架构,并以开源形式邀请全球开发者共同优化,旨在推动个人生产力提升和企业流程优化
在2025年“智会”生态合作大会上,专家和科技企业代表聚焦公共安全、司法取证技术创新及智能装备发展,重点展示“星睿取证分析大模型一体机”。该设备结合深度学习与便携性,旨在提升电子数据取证效率与安全性,预示AI技术在司法领域的重要应用前景。大会亦探讨了智能科技在公共安全与司法取证的应用趋势
Anthropic CEO 达里奥·阿莫迪在“与克劳德一起编程”开发者活动中提出,当前AI模型产生“幻觉”或虚假信息的频率低于人类,且这一问题不会阻碍AI向人类水平智能(AGI)发展。尽管有行业领袖对此持不同意见,阿莫迪强调即使AI存在幻觉问题,也不影响其智能水平的评估
Anthropic推出四项新API功能,包括代码执行工具、MCP连接器、文件API和扩展提示缓存,旨在增强AI代理的智能与效率,简化开发流程,并提高性能与成本效益。这些功能扩展了AI在数据处理、分析以及与外部系统整合的能力,体现了Anthropic构建开放AI生态的努力
Mistral 与 All Hands AI 合作推出240亿参数的语言模型 Devstral,以较低计算资源需求实现高效性能,适用于本地部署和设备端使用。该模型遵循 Apache2.0 许可证,提供灵活的开源使用权限,专注于解决软件工程难题,并在 SWE-Bench Verified 基准测试中表现出色,领先于其他开源及闭源模型。Devstral 通过 Le Platforme API 提供经济
OpenAI计划推出一款革命性的紧凑型无屏幕硬件设备,定位为继MacBook Pro和iPhone之后的“第三大核心设备”。此设备旨在成为用户的“AI伴侣”,具有全面感知环境的能力。此举与OpenAI收购io公司(由苹果前首席设计官Jony Ive创立)紧密相关,预计将增加公司市值并开辟新的设备类别。然而,产品保密问题及市场接受度仍构成挑战
OpenAI 与阿联酋 G42签署战略合作,共同建设全球最大AI数据中心集群于阿布扎比,总电力需求高达5GW。此项目标志着OpenAI首次海外扩展,并在亚太地区积极布局,以加速AI技术的全球应用与发展
苹果公司计划于2026年底推出搭载先进AI技术的智能眼镜,集成摄像头、麦克风,并以Siri为核心交互助手,旨在提升用户体验。研发进度加快,年底前将生产原型机进行测试,预计将引领市场趋势
阿联酋宣布建设“星际之门阿联酋”超级人工智能数据中心,与OpenAI、英伟达等全球科技公司合作,预计2026年投入运营。项目旨在增强阿联酋在AI领域的全球影响力,并计划为全国民众提供免费的ChatGPT Plus服务。此举反映了阿联酋在AI基础设施和科技普及方面的战略决心
奥斯汀初创公司Throne凭借其AI驱动的肠道健康监测设备获得400万美元种子轮融资,由Moxxie Ventures领投,兰斯·阿姆斯特朗等知名人士参与。该设备通过计算机视觉技术监测用户肠道健康状况,并计划于2026年1月推出。Throne将利用资金完善产品开发,并与学术机构合作研究
京东工业在上海发布行业首个以供应链为核心的工业大模型Joy industrial,通过AI技术提升运营效率,涵盖需求、运营、关务等多环节智能体,助力各垂直行业供应链优化。该模型显著提升商机匹配效率、商品管理和供应链集成,增强国际化业务合规效率,树立了供应链管理新标杆
Anthropic推出Claude4系列模型,包括编码能力卓越的Claude Opus4和推理能力提升的Claude Sonnet4,通过SWE-bench Verified认证,表现行业领先。新模型面向广泛用户群开放,引发市场关注与期待
Anthropic 推出 Claude4 系列模型,包括 Claude Opus4 和 Claude Sonnet4,强调实用性,具备强大的编程和推理能力,可在多种开发环境中应用,显著提升开发效率
Anthropic在其首届开发者大会上推出业界领先的Claude4系列AI模型,包括面向编程优化的Claude Opus4和Claude Sonnet4。这些模型在基准测试中表现出色,具备处理复杂任务的能力,并针对编程任务进行了优化。Anthropic通过强化安全和推出新的编程工具升级,旨在保持其在AI领域的竞争力,并实现公司的收入增长目标
字节跳动Seed团队发布开源多模态基础模型BAGEL,采用混合专家(MoE)架构,预训练于数万亿token的交错多模态数据集,性能超越Qwen2.5-VL和InternVL-2.5,图像生成质量媲美SD3,支持复杂推理任务。BAGEL的开源特性及其在多模态理解与生成领域的突破性进展,为AI技术普惠化和创意产业带来新动力,引发全球AI社区广泛关注
商汤科技联合京东推出元萝卜AI下棋机器人五合一版,专为3至12岁儿童设计,集象棋、围棋、国际象棋、国际跳棋和五子棋于一体的智能教育硬件。该产品通过AI互动交流促进学习兴趣,提供全科辅导和英语口语练习,现已在京东独家发售
美年健康集团与阿里巴巴达摩院达成战略合作,共同探索利用“一扫多查”医疗AI技术进行重大疾病筛查,包括癌症和慢性病。该技术能在单次CT扫描中识别多种病变,实现早期诊断,并在体检场景中验证其准确性,旨在提升诊断效率与个性化健康服务
普林斯顿大学、哥伦比亚大学及Cyberever AI公司联合推出3DTown框架,能够基于单张俯视图生成逼真、连贯的3D城镇场景。该框架免训练,利用预训练的3D对象生成器和独特的区域生成、空间感知3D修复技术,实现了高质量3D场景的快速构建,显著优于现有Image-to-3D生成模型,具有广泛的应用潜力
Mistral AI 与 All Hands AI 合作推出了一款开源 AI 编程模型 Devstral,拥有240亿参数,采用 Apache2.0 许可,支持商业用途。该模型推动了主动式编程的发展,通过高效参与代码生成和开发任务,提升开发者应对挑战的能力。Devstral 可通过 Mistral API 访问,且在性能测试中超越多款领先模型,易于部署和运行,适用于代码库探索和多文件编辑
腾讯发布混元 TurboS 技术报告,旗舰大语言模型 TurboS 在 Chatbot Arena 排名第七,采用 Hybrid Transformer-Mamba 结构实现性能效率平衡,引入自适应长短思维链机制增强响应能力,展示腾讯在大语言模型领域的技术实力
TCL与阿里云宣布全栈AI战略合作,聚焦半导体显示和智能终端领域,利用阿里云的“云+AI”技术优势,联合开发专业大模型解决方案。双方将共同优化星智X-Intelligence大模型,并开发垂直化模型以提升研发和生产自动化水平。此外,TCL雷鸟创新与阿里云独家合作,利用通义系列大模型提升产品创新能力,并在国际化布局中依托阿里云平台进行市场拓展,为TCL数字化转型提供技术保障
阿布扎比技术创新研究院(TII)在“阿联酋制造”大会上发布了两款人工智能大模型——Falcon Arabic和Falcon H1,分别针对阿拉伯语环境和低算力需求。此举旨在提升定制化AI解决方案的可用性。Falcon系列模型曾引发关注,但用户数量有所下降。新模型Falcon Arabic具备处理复杂阿拉伯语文本的能力,而Falcon H1旨在提升通用性和降低使用门槛。同时,阿联酋正积极扩展其全球A
Meta公司推出J1系列AI模型,显著提升判断准确性和公平性,采用强化学习与合成数据训练。此技术为“LLM-as-a-Judge”模式,有助于AI评估和判断,解决传统评估方法局限。J1模型在泛化能力和消除偏见方面取得突破,基准测试成绩优异,为AI在复杂推理和伦理决策的应用奠定基础
华为数学团队推出FlashComm技术,通过优化AllReduce通信操作、调整矩阵乘法并行维度及多流并行技术,实现大模型推理性能最高提升80%。此举标志着华为在大模型推理领域的重大技术突破,将推动AI应用发展
红帽公司推出红帽 AI 推理服务器,针对混合云环境提供高效经济的 AI 推理服务。该服务器采用 vLLM 技术和 Neural Magic 创新能力,提供智能模型压缩与优化工具,提升推理效率2-4倍,并支持灵活部署及企业级支持
腾讯在2025年AI产业应用峰会上全面展示了其大模型战略,升级自研混元大模型等AI产品,致力于为企业提供智能解决方案,并计划开源多模态基础模型。此举旨在推动企业智能化转型,加强数字经济的竞争力
Meta公司推出“Llama创业计划”,支持初创企业采用Llama AI模型,提供最高6000美元/月的资金支持,旨在巩固其在生成式AI市场的领导地位,同时应对激烈的市场竞争
字节跳动旗下北京字跳网络技术有限公司已申请注册多枚“PIPPIT”商标,涉及多个领域,目前处于审查阶段。此举反映公司正强化在AI营销领域的战略布局
Framer在I/O2025期间发布全新AI功能套件,包括Wireframer、Workshop、Advanced Analytics和Vectors2.0,通过AI技术实现快速网站布局生成、交互组件设计、数据分析及矢量绘图升级。这些功能显著降低了网站创建成本与复杂度,获得全球设计师和开发者社区高度评价。AIbase指出,Framer新功能推动了AI在网站设计领域的深入应用,实现了设计民主化,为行
阿联酋技术创新研究院(TII)推出两款新人工智能大模型——Falcon Arabic与Falcon H1,分别针对阿拉伯语环境与低算力应用,标志着该国在AI领域的重要进展。Falcon Arabic为首个专注阿拉伯语的大模型,具备处理超长上下文的能力。同时,阿联酋积极布局全球AI产业,参与基础设施建设与国际合作
谷歌DeepMind推出音乐生成模型Lyria2,实现高保真音质与实时交互,支持多风格创作,为音乐创作领域带来革命性变化。该模型通过Music AI Sandbox提供全面创作支持,同时注重伦理与安全性,采用数字水印技术保障版权。尽管存在版权与原创性挑战,Lyria2仍被视为音乐创作效率提升的重要工具
在杭州市十四届人大五次会议上,市长姚高员在政府工作报告中重点提及人工智能企业DeepSeek及其开源大模型,肯定其在低成本下取得的显著成就,并强调其全球影响力。DeepSeek作为“杭州六小龙”之一,代表了杭州科技创新力量,受到广泛关注。市政府提出“三个15%”政策,为人工智能产业提供政策与资金支持,预示杭州将继续巩固在人工智能领域的领先地位
普林斯顿大学、字节跳动、清华大学及北京大学联合研发的多模态大模型 MMaDA,通过其统一的扩散架构、混合长链式思考微调策略和统一强化学习算法,实现了 AI 的深度思考和跨模态一体化处理。MMaDA 在文本推理、多模态理解和文本到图像生成等领域表现卓越,超越了现有主流模型,为多模态 AI 领域提供了新的研究框架和应用潜力
微软研究院开源Magentic-UI,一款以人为中心的AI智能体研究原型,通过网页浏览器实时协助用户完成复杂网络任务。该系统基于Magentic-One多智能体系统和AutoGen框架,强调透明性、可控性和人机协作,支持用户干预和任务规划,提供高效、安全的复杂任务处理能力。Magentic-UI遵循MIT许可证开源,旨在推动人机协作技术研究和AI应用开发
OpenAI宣布以65亿美元全股收购Jony Ive创立的AI硬件初创公司io,计划推出革命性AI“伴侣”设备,目标在2026年底前发货1亿台。该设备将融合高级设计和Grok AI技术,成为继MacBook Pro和iPhone之后的“第三核心设备”,挑战现有AI硬件市场,开辟AI日常应用新路径
硅基流动(SiliconCloud)对其推理模型API进行升级,实现128K最大上下文长度,增强模型思考和输出能力。同时,引入独立控制思维链和回复内容长度的功能,提升开发者配置灵活性。长度限制超标时,输出将自动截断并标注原因
NotebookLM,谷歌旗下的人工智能笔记工具,六个月内月访问量激增56%,成为AI领域的瞩目焦点。该工具以其创新的“音频概览”功能及多语言支持,提升用户信息获取效率,广泛适用于学术研究、工作总结及娱乐创作等多个场景,深受各用户群体欢迎
xAI推出Live Search API,实现实时动态搜索X平台、互联网和新闻等,目前免费Beta测试至2025年6月。该API具备无需手动管理逻辑、自主决策和高度定制化特性,为开发者提供强大的实时信息检索能力。API的易用性和灵活性受到社区欢迎,预计将推动智能搜索和实时数据分析的发展
xAI推出网页搜索API Live Search,实现Grok模型对网络、X平台、新闻及RSS订阅源等数据的实时搜索,强化了智能应用的动态数据处理能力。此API免费公测,提供灵活的搜索控制和智能化搜索决策,适用于实时数据支持的AI应用场景,如聊天机器人、AI代理等。公测期内,开发者可享25美元免费额度。该API的推出增强了xAI在AI生态系统中的竞争力
TCL集团与阿里云签订全栈AI战略合作,旨在推进半导体显示与智能终端领域的智能化转型,共同研发垂直行业大模型。双方将聚焦大模型推理、多模态理解和智能检索技术,计划三年内打造智能中枢,并推出首个专注于半导体显示的强推理大模型“星智 X-Intelligence”,助力行业智能化升级
昆仑万维发布天工超级智能体,基于自研Deep Research技术,具备多模态内容生成能力,成本效益显著,性能超越OpenAI Deep Research,引领AI生产力工具市场变革。该智能体由5个专家智能体和1个通用智能体组成,支持多种格式内容生成,具有广泛应用前景,并在全球AI社区引发热议
谷歌推出SynthID Detector工具,旨在检测AI生成内容,可识别图像、文本、音频和视频中的SynthID水印。该工具目前面向早期测试者,计划逐步开放给更广泛用户,以提升内容透明度
OpenAI推出 Responses API 升级,引入 Model Context Protocol 支持、图像生成、代码解释器和后台模式等新功能,显著提升智能体开发效率。此更新在开发者社区引起热烈反响,被视为OpenAI推动AI智能体生态发展的重要进展。新API通过单次调用实现多功能智能体开发,具有低成本和高度开放性,有望促进AI技术的普及化和开源化,并对全球AI开发产生深远影响