OpenAI 对亿万富翁埃隆·马斯克提出反诉,指控其违法行为并寻求损失赔偿。马斯克声称 OpenAI 背离非营利初衷,双方法律纠纷将于2026年审理。同时,多个组织请求阻止 OpenAI 转型为盈利性实体,担忧其破坏慈善使命。OpenAI 强调转型旨在增强非营利部门实力,否认马斯克对其使命的关心
近日,AI代码生成领域迎来开源热潮,Deep Cogito推出的Cogito v1Preview系列模型备受关注。该系列涵盖3B至70B多种规格,性能超越同级别竞争者,其中70B版本领先于Meta的Llama4109B MoE模型。模型针对编码任务优化,支持双模运行,并通过API开放给开发者,预示着AI编程领域的新突破。Cogito团队计划推出更大规模模型,有望重塑市场格局,开启AI编程新浪潮
苹果公司计划在iOS19系统中大幅提升人工智能功能,开放摘要生成API接口,提供自动对话摘要,并推出基于关键词的定制化通知管理。同时,Genmoji生成式表情功能将局限于新款iPhone设备,但可能通过订阅服务扩展至旧款设备。苹果的人工智能助手Siri仍需改进,以优化用户体验
谷歌近日推出了Gemini-2.0-flash-live-001模型,作为Gemini系列Live API的公开预览版本,该模型在速度、稳定性和功能上均有显著提升,特别适用于需要即时响应的实时应用。此更新标志着谷歌在实时AI交互技术上的重要进展,并旨在满足开发者对高效AI工具的需求,为多行业带来创新应用的可能性
OpenAI 实施先锋计划,旨在优化 AI 模型评估体系,通过设计定制化基准测试以增强实际应用相关性。计划与法律、金融、医疗等行业合作,针对特定领域开发评估标准,并与初创公司合作提升模型性能,同时面临社区接受度和道德争议的挑战
谷歌推出的“地球AI大脑”系统,融合深度学习与多模态数据处理技术,构建了一个革命性的地理智能分析平台。该系统通过分析地理、天气和社会经济数据,提供对地理位置相关复杂问题的即时洞察,并已在灾害响应、公共卫生、气候适应力及商业决策等多个领域展现出巨大潜力。此技术突破标志着地理信息系统智能化进程的重要进展,但同时也面临资源消耗与普及平衡的挑战
OminiControl Art”技术于2025年4月9日发布,融合了OpenAI GPT-4o的艺术风格与FLUX.1模型的性能,通过OminiControl框架实现艺术风格的迁移与优化。该技术简化了艺术图像生成流程,提升了用户创作体验,标志着AI艺术生成领域的技术进步,预示着AI与艺术融合的新趋势
谷歌DeepMind宣布将在其Gemini模型和软件开发工具包中支持Anthropic的模型上下文协议(MCP),旨在推动AI代理时代的开放标准,并促进AI模型与多种数据源之间的双向连接。此举紧跟OpenAI的类似决策,反映了行业对开放标准的采纳趋势
谷歌云平台宣布Vertex AI Model Garden集成Meta最新开源大模型Llama4系列中的Scout和Maverick,通过“模型即服务”API端点提供预览,深化了双方在AI生态的合作,为开发者简化了尖端模型的部署过程。Llama4系列模型以其多模态能力和创新架构受到关注,有望推动AI技术广泛应用于各行业,加速AI民主化进程
在Google Cloud Next2025大会上,Google Cloud宣布与NVIDIA合作,将Google Distributed Cloud与Gemini AI模型和NVIDIA Blackwell架构结合,为企业提供本地化AI解决方案。该方案强调数据主权与安全性,支持敏感数据处理,并计划推出GKE Inference Gateway优化AI工作负载。此合作被视为AI部署模式的重大转变,
Anthropic公司推出Claude Max订阅计划,最高月费200美元,针对高端用户,提供两种定价选项,显著提高使用限制。同时,公司探索教育领域AI需求的“Claude for Education”项目,以应对AI模型开发的高成本
xAI公司宣布其新一代人工智能模型Grok3及其轻量版Grok3Mini在OpenRouter平台上线,强化了语言模型的选择。Grok3适用于复杂任务,而Grok3Mini针对速度与成本效率进行了优化。两款模型均支持长文本处理,并在推理任务中表现出色。该系列模型的推出是xAI技术的重大升级,旨在满足专业领域的应用需求,并与OpenAI SDK兼容,增强开发者应用的灵活性。Grok3系列模型的发布加
Safe Superintelligence(SSI),由OpenAI联合创始人兼前首席科学家Ilya Sutskever创立,已与谷歌云建立合作伙伴关系,利用TPU芯片加速其安全超级智能AI的研发。此合作标志着SSI将大部分计算预算投入谷歌云,后者成为其主要计算服务提供商。SSI自成立以来已获得10亿美元投资,专注于开发安全的超级智能AI系统
在Google Cloud Next2025大会上,谷歌发布开源智能体开发框架Agent Development Kit(ADK),简化多智能体系统开发流程,展示其在AI领域的雄心。ADK以模块化设计、高度灵活性、多模态交互和深度生态系统整合为核心特性,支持无缝本地到云端部署,为企业级AI应用提供强大支持。其开源策略及企业赋能特性预示ADK将成为AI智能体开发的重要里程碑
谷歌DeepMind推出的人工智能视频生成模型Veo2,已通过Gemini API面向开发者开放。Veo2具备从文本和图像生成高质量视频的能力,为创意产业带来新动力。该模型在运动准确性、镜头控制和画面一致性上实现优化,通过API支持多样化应用开发。同时,谷歌采取措施减少技术误用风险,并优化资源分配与稳定性。Veo2的普及预计将推动AI视频生成领域的变革
谷歌云推出开源协议A2A,旨在促进不同厂商和框架构建的AI智能体之间的无缝协作与信息交换,解决智能体间的通信壁垒问题。A2A协议遵循五大关键原则,得到50多家技术合作伙伴支持,旨在推动AI在企业中的应用,实现高效智能的工作流程。该协议将开源发布,鼓励社区参与,预计将推动智能体互操作性的发展
多个团体向加州总检察长提交请愿书,反对OpenAI从非营利机构转型为盈利公司。OpenAI计划通过转型筹集资金,但被指控未能保护慈善资产,偏离了其推动安全人工智能的初衷。请愿者认为,OpenAI的转型可能导致公众利益受损
2023年4月9日,StepFun与复旦大学联合研发的OmniSVG模型,作为目前最先进的SVG生成大模型,实现了矢量图形生成技术的重大突破。基于Qwen-VL视觉-语言模型,OmniSVG具备卓越的多模态生成能力,能够高效生成复杂且高质量的SVG图像。同时,OmniSVG团队发布的MMSVG-2M数据集和MMSVG-Bench评估协议,为SVG生成技术的研究提供了重要资源,预示着SVG在数字设计
Adobe 宣布即将推出 Photoshop 和 Premiere Pro 的 AI 代理功能,旨在通过智能助手简化编辑过程,提高创作效率,并为创作者提供更多创意可能性
Alphabet宣布2023年将投入约750亿美元用于扩建数据中心及支持AI服务,以强化搜索等核心业务竞争力。Alphabet首席执行官皮查伊强调,尽管经济形势严峻,AI领域投资仍具巨大潜力,旨在维持科技行业领先地位。同时,美国其他科技巨头也在增加AI基础设施投资,争夺市场主导权
京东零售技术团队成功研发TimeHF模型,基于RLHF技术实现十亿级销量预测,提升预测准确度10%以上,显著降低需求端预测不确定性。TimeHF在内部应用及公开数据集上均表现卓越,成为时间序列预测领域新标杆。京东团队在数据集构建、模型设计及训练方案上实现创新,为供应链管理带来革新,并计划于4月19日分享技术细节
微信视频创作安全中心宣布,部分主播违规使用AI工具直播,违反平台规范,扰乱生态。平台将依据违规程度对相关直播间实施处罚,包括弹窗提醒、减少推荐至禁播等。违规行为包括换脸冒充他人、未申请资质直播专业内容、利用AI教学违规直播等。平台鼓励合规使用AI,反对违规行为,并鼓励用户举报,以维护直播环境秩序
阿里云推出全生命周期的MCP服务,显著降低大模型应用开发门槛,实现快速创建智能体和全流程自动化。MCP协议生态持续扩展,促进大模型技术在多领域广泛应用,推动产业化应用新阶段
科大讯飞宣布对旗下深度推理模型星火 X1进行重要升级,旨在提升其推理能力、文本生成和语言理解表现,以期比肩OpenAI o1和DeepSeek R1模型。该升级预计将在数学能力上实现突破,增强星火 X1的市场竞争力,巩固科大讯飞在人工智能领域的地位
天津市教委发布实施意见,计划自2025年秋季学期起,在全市中小学全面开展人工智能教育,四年级和八年级开设《人工智能基础》课程。该政策旨在提升学生人工智能素养,分阶段实施,预计至2028年形成高质量的课程与评价体系
谷歌在 TED 大会上展示了集成了 Gemini 人工智能助手的增强现实眼镜原型,具备实时翻译等多功能应用。同时,与三星合作的混合现实头显也亮相,实现虚拟与现实的融合体验。然而,成本问题和电池续航仍是推广此类设备至大众市场的关键挑战
联影科技发布“元智”医疗大模型,结合大量医疗影像数据,提升影像诊断效率和准确性,支持多种影像处理任务,准确度超过95%。同时推出10余款医疗智能体,覆盖影像诊断至医院管理等多领域,推动医疗行业智能化、数字化发展
Atypica.AI 是一款创新的用户洞察代理工具,通过智能化方法为企业提供深入的用户研究报告。该工具简化了用户研究过程,通过生成虚拟访谈任务,提供基于真实访谈的用户角色与洞察。Atypica.AI 的应用展示了 AI 在市场研究领域的巨大潜力,为品牌方提供了一种新的用户洞察途径
广东省人工智能与机器人产业创新发展领导小组推出8个人工智能行业大模型、30个应用场景、29个解决方案及13款智能终端产品,旨在推进AI技术产业化、产品市场化和服务商业化。这些创新成果已实现初步应用并取得显著成效,标志着广东在AI领域的重要进展,助力AI技术融入各行各业
中国AI领域正迎来技术标准变革,Model Context Protocol(MCP)成为国内AI生态事实标准,阿里巴巴和腾讯等科技巨头纷纷宣布支持。MCP协议旨在标准化AI模型与工具服务的交互,提升互操作性。此趋势凸显MCP在AI开发中的核心地位,并预示中国科技企业在全球AI标准竞争中的新角力。然而,MCP的普及与生态成熟度仍需验证,且需关注兼容性与安全性挑战
广汽集团发布第三代人形机器人GoMate,已在安防领域应用,未来将拓展至汽车生产线及后服务市场。GoMate利用新能源汽车相关技术,具备创新的“轮足结合”构型设计,以及强大的决策能力、运动控制和操作能力。广汽集团计划逐步推进GoMate的量产和应用
Waymo计划利用无人驾驶出租车内的摄像头数据训练AI模型,并可能用于定向广告,但强调尚在开发阶段且不会改变隐私政策。乘客可根据加州消费者隐私法案选择退出数据共享。Waymo,作为美国唯一运营商用自动驾驶出租车服务的公司,拥有约700辆出租车,其隐私政策及数据安全问题备受关注
2025年第一季度,全球PC出货量同比增长4.9%,达到6320万台,超出IDC先前预期。联想以24.1%市场份额位居全球首位,增长速度领先。市场需求强劲回升,主要得益于Windows10系统即将停止支持及端侧AI需求增长。此外,PC生态系积极应对,以满足需求
本文探讨了AI艺术作品在社交媒体上的流行,特别是模仿吉卜力工作室风格的AI生成图像。专家指出,尽管技术进步带来便利,但AI艺术作品缺乏艺术家创作过程中的灵感和情感,引发了关于艺术价值与创作原意的讨论
vivo 宣布对其人工智能部门进行重大重组,撤销原有部门,成立专注于产品与技术开发的新部门,以适应市场需求和技术发展,强化产品专业性和算法性能。此举体现了 vivo 对 AI 领域的持续重视和战略调整
Quartz经历低价出售,其编辑团队大规模裁员,凸显了媒体行业过度依赖低质量人工智能可能带来的严重后果。此次事件再次提醒,盲目追求AI生成内容而非专业编辑工作,可能损害新闻质量并破坏媒体生态
安德里森・霍洛维茨(a16z)宣布筹集高达200亿美元基金,专注于支持美国人工智能初创企业,反映全球对AI领域投资热情的增长,旨在推动行业创新与发展
谷歌AI平台Gemini更新,全面上线并增强“Deep Research”功能,升级至Gemini2.5Pro实验模型,提供更强大的研究支持。该功能通过AI深度分析,帮助用户快速整理复杂信息并生成详尽报告,现已向免费用户开放,并整合Audio Overviews功能。此举标志着Gemini向专业研究工具转型,增强其在AI助手市场的竞争力
亚马逊推出新型AI语音模型Nova Sonic,显著提升速度、识别准确性和对话质量,达到行业领先水平。该模型以高性价比脱颖而出,并通过亚马逊Bedrock平台提供服务,支持创新的API接口。Nova Sonic的智能化处理和自然对话能力增强用户体验,其在Alexa +中的应用标志着亚马逊向人工通用智能战略迈进的关键进展
三星预计本周发布AI伴侣机器人Ballie,作为智能家居生态的关键组件,Ballie将提供创新的交互体验,并具备语音控制、智能任务执行等功能。该产品经过多年技术优化,预计今年内在美国上市,并可能采用订阅模式降低消费者门槛
OpenAI 发布经济蓝图,强调四大原则以加速欧洲在人工智能领域的发展,包括建立技术基础、简化法规、促进广泛应用及确保与欧洲价值观一致。建议EU在计算能力、数据、能源和人才方面进行大规模投资,简化复杂监管环境,并计划至2030年培养1亿欧洲人掌握AI技能,以提升全球竞争力
皮尤研究中心报告指出,美国民众对人工智能的态度与专家显著不同,专家普遍乐观,而民众则表现出焦虑。调查显示,大多数受访者不信任政府和私人企业监管人工智能,并希望增加对人工智能应用的控制
亚马逊发布新型AI语音模型Nova Sonic,旨在增强其语音助手Alexa+性能,实现更自然流畅的语音交互。该模型整合了语音理解与生成能力,优化了对话体验,并在成本、速度、识别质量上与行业领先模型竞争。Nova Sonic在复杂环境下表现出色,为开发者提供了成本效益高的新选择
本摘要概述了“PDF Document Layout Analysis”服务的上线,该服务通过Docker技术提供高效的PDF文档解析,支持文本、表格和图像的分离与分类,适用于多种场景。基于机器学习模型,服务展现了高精度和快速部署的优势,同时开放源代码以促进社区合作。此服务对推动文档处理智能化转型具有行业意义,未来将扩展功能并增强性能
富国银行AI助手Fargo在2024年实现2.45亿次交互,通过谷歌Flash 2.0技术保障服务效率和安全性。系统专注于日常银行事务处理,提升用户粘性,并采用严格的数据隐私保护措施。银行正探索多云策略,研究自主系统,以提高业务效率,并对AI应用的未来发展持积极态度
WHEE平台推出的Miracle F1人工智能图像生成模型,实现了图像生成质量的显著提升,具备高真实感、精准语义理解和风格多样化等特点,为AI图像创作带来突破性进展,并广泛应用于电商、活动视觉和插画海报等领域
OpenAI推出Evals API,实现AI模型评估的自动化与程序化,提高开发效率和优化速度,同时为提示工程提供新可能性。该API的发布标志着模型评估进入高度自动化阶段,有望加速AI应用开发并提升性能验证质量,但同时也对开发者的专业知识和资源管理提出了挑战
Quartz经历管理变动,被G/O Media出售给Redbrick,伴随大规模裁员,几乎所有编辑人员遭解雇。此前,Quartz的AI内容生成策略导致信息准确性问题,引发公众批评。此举反映了媒体行业的波动,G/O Media在过去一年内持续出售资产
OpenRouter宣布重大政策调整,将每日免费模型调用次数从200次降至50次,同时推出账户余额激励措施,余额超过10美元用户每日调用次数提升至1000次。此政策在开发者社区引发讨论,体现了AI服务提供商在市场发展中的战略调整,旨在控制成本、优化资源分配,并保障服务质量。此举可能影响行业标准和商业模式,反映了AI行业向精细化运营转变的趋势
谷歌即将推出旗下人工智能研究工具NotebookLM的独立移动客户端应用程序,旨在提供更便捷的移动端使用体验。此升级预示着NotebookLM将从网页端扩展至更广泛的用户群体,并持续优化功能,如自动搜索、总结网页内容,以及深度整合谷歌搜索能力,强化AI驱动的智能研究体验
Anthropic公司发布的研究报告揭示了大学生在日常学习中广泛使用AI工具的现象,特别是理工科学生成为早期使用者。报告指出,大学生主要利用AI进行创造性任务、分析任务和问题解决,引发了对教育模式、评估体系和学术诚信的深入思考。研究同时提出,需关注学生过度依赖AI可能削弱其基础技能的风险,并探讨如何在AI时代保持教育的本质,促进学生的全面发展和独立思考能力
DeepSeek AI推出自主演原则的批判调优技术(SPCT),旨在提高大型语言模型(LLM)奖励模型(RMs)的通用性和扩展性,以应对开放式任务和复杂环境中的挑战。该技术通过动态生成原则和评论,显著提升了奖励质量及推理时的可扩展性,并在基准测试中优于现有基线方法。SPCT有望推动企业级AI应用的发展,尽管在效率和某些任务上的性能仍有提升空间
近日,notion-mcp-server 项目发布,实现了Notion API与MCP(Model Context Protocol)服务器的集成,允许AI应用通过标准化协议无缝操作Notion数据库和页面。该进展显著拓展了Notion应用场景,支持自然语言指令自动化任务执行,增强AI上下文感知能力,并促进Notion与开发环境的集成,预示着Notion在AI生态中的深入融合
斯坦福大学人类中心人工智能研究所(HAI)发布的《2025年人工智能指数报告》指出,2024年全球AI领域呈现显著发展态势,包括性能差距缩小、成本下降及全球应用加速。中美顶级AI模型性能差距大幅缩小至0.3%,AI技术经济性提升促进普及,全球AI投资和教育布局持续增长。报告同时指出,企业成为AI研发主导力量,而全球对AI的态度出现区域分化,技术伦理和安全问题亟待关注
Agentica团队推出全新开源AI编码推理模型DeepCoder-14B,性能可比OpenAI的o1和o3-mini,具有卓越的编码推理能力,能高效生成高质量代码。该模型采用创新训练策略,支持超长上下文,完全开源,提供完整数据集和训练方法,为AI研究及开发注入活力,并有望推动技术民主化。业内专家认为,DeepCoder-14B的发布为预算有限的小型企业和开发者提供了获取尖端技术的机会,但其极端复
英伟达推出开源大语言模型Llama3.1Nemotron Ultra253B,性能超越现有竞争模型,具备高效资源利用和多任务处理能力。该模型拥有2530亿个参数,支持超长上下文长度,通过神经架构搜索和垂直压缩技术实现优化。Nemotron Ultra的开源特性促进了AI技术民主化,但其在大规模任务和特定领域的表现及伦理挑战仍需进一步评估。该模型的推出标志着AI领域的性能与效率新标杆,为AI应用拓展
英伟达发布新型大型语言模型Llama3.1Nemotron Ultra253B,基于神经架构搜索技术优化,性能超越Llama4系列中的Behemoth和Maverick,并以开源形式在Hugging Face平台发布,为AI领域带来高效、商业友好的模型,巩固了英伟达在AI硬件与软件开发领域的领先地位
英伟达发布Llama3.1Nemotron Ultra253B开源AI模型,参数规模达253亿,性能超越Meta的Llama4系列,表现出色。该模型以高效设计实现小模型的高性能,并通过商业友好许可开放使用,推动AI技术广泛应用。其多功能性有望在代码生成、科学研究等领域引发行业变革
Cloudflare推出了一款名为AutoRAG的全托管检索增强生成系统,简化了AI开发流程,允许开发者通过指向数据源快速搭建上下文感知的AI系统。该系统具备自动更新、多模态数据处理和高度集成灵活性,且在公测阶段免费开放。AutoRAG的推出标志着Cloudflare在AI基础设施领域的战略升级,为各行业智能化转型提供了新的动力
阶跃星辰科技推出多模态推理模型Step-R1-V-Mini,实现多模态协同推理新突破。该模型采用多模态联合强化学习技术,具备高精度图像感知和复杂推理能力,并在多个公开榜单上取得优异表现。Step-R1-V-Mini已上线阶跃AI网页端并提供API接口,未来将推动AI技术发展
人工智能领域再获突破,Together AI 与 Agentica 联合开源的 DeepCoder-14B-Preview 模型,以140亿参数在代码测试平台LiveCodeBench取得60.6%的得分,超越OpenAI的o1模型,逼近o3-mini。该模型开源内容全面,包含权重、数据集等,助力开发者深入研究和应用。DeepCoder的创新技术包括高效的数据处理、奖励函数设计,以及流水化训练流程
截至2023年3月31日,网信上海公告显示,346款生成式人工智能服务完成国家网信办备案,159款通过API接口等方式调用备案模型的应用在地方网信办登记。相关部门强调,所有上线生成式人工智能应用需公示已备案服务信息,以促进行业规范健康发展
谷歌宣布其AI研究工具“Deep Research”完成重大升级,采用最新Gemini 2.5 Pro实验版技术支持,显著提升搜索效率与研究成果分析价值。此升级标志着研究方法根本性变革,为学术和商业研究带来革命性变化,巩固了谷歌在生成式AI市场中的竞争地位,开启智能高效研究新时代
本文摘要:生成式AI技术最新进展实现了高度逼真的AI虚拟化身,具备自然语音和面部表情同步能力,标志着人机交互领域的重大突破。该技术已展现商业潜力,为销售、教育、娱乐等行业带来变革,同时引发了关于隐私、数据安全和知识产权的伦理讨论。未来,AI虚拟化身将面临技术优化与伦理规范的平衡挑战,成为数字世界核心交互元素
摘要:近期,SiteMCP工具在技术领域引发关注,该工具能够将网站内容转化为MCP服务器,实现交互式知识体验。最新更新引入了两项关键改进,并得到社区积极响应。尽管存在性能限制,但SiteMCP的便捷性和创新性受到行业认可,其在编程和工程社区中的影响力持续扩大,展现了传统网络内容与交互技术结合的新趋势
抖音宣布上线“辟谣卡”功能,通过人工智能与大模型技术高效识别和处理不实信息,提升信息透明度与可信度,帮助用户全面了解谣言的起源、传播及真相,增强用户甄别不实信息的能力
甲骨文正在德克萨斯州为OpenAI建设大型数据中心,但建设进度缓慢引发担忧。若建设无法如期完成,可能导致OpenAI终止合作,给甲骨文造成巨大财务损失。同时,项目面临的挑战包括能源系统建设和成本上涨,而OpenAI正考虑与其他竞争对手合作,为甲骨文的未来增加了不确定性
人工智能指数报告2025》揭示了全球人工智能领域的最新进展,指出AI技术正以惊人速度发展,尤其在模型性能、硬件效率和行业应用方面取得显著成就。报告显示东亚地区在AI论文产出上领先,中国专利增长迅速,预示中国在AI领域的研究和应用正加速发展。硬件效能大幅提升,绿色AI成为未来焦点。开源项目活跃,美国在GitHub社区贡献突出。技术性能持续突破,自动驾驶安全性提升。负责任AI受到重视,学术界和企业界均
摘要】 全国各省市积极推出大模型算法备案奖励补贴政策,以促进人工智能技术的合规发展,最高补贴达5000万元。备案制度旨在保障数据安全和算法透明,维护网络空间秩序,促进行业健康发展。截至2025年3月,备案数量显著,涵盖多领域。专家指出,备案政策旨在为企业提供合规跑道,鼓励技术创新与数据安全并重
Skywork AI 研发的新型视频生成框架 SkyReels-A2,实现了基于文本提示的高质量视频合成,具备将视觉元素自然融合的能力,并通过双分支策略优化视频生成质量与速度。该框架的推出为影视及电商领域带来创新潜力,并伴随全面评估基准 A2Bench,为视频生成技术设立新的评估标准
中国科学院自动化研究所与中科紫东太初团队研发的Vision-R1方法,通过融合类R1强化学习技术,显著提高了视觉定位性能,实现了50%的性能提升并超越现有最优模型。该研究创新性地采用指令对齐数据与强化学习,设计多目标预测和奖励机制,显著提升模型在复杂视觉任务中的表现,为多模态AI应用提供了新方向
Sync Labs 推出全球首个零-shot 嘴型同步模型 Lipsync-2,无需额外训练即可实现高真实感和表现力的嘴型同步,适用于多种内容创作。该技术突破传统限制,提升创作效率,并具有广泛的应用前景,包括多语言教育和AI生成内容,预示着内容创作和视频技术的革命性变革
IBM宣布推出全新大型机IBM z17,搭载Telum II处理器,专为AI应用而设计,每日可处理4500亿次推理运算,性能比前代产品提升50%。该产品旨在与其他硬件、软件及开源工具集成,满足企业计算需求。据预测,到2024年大型机市场价值将达53亿美元。IBM z17预计6月8日上市
酷狗音乐与人工智能公司DeepSeek达成战略合作,运用大模型技术推出四大AI功能模块,重塑音乐消费全链路体验,设立AI与音乐融合新标杆。其中包括个性化“AI听歌报告”、智能歌单管家,以及基于语义理解的UGC内容优化,显著提升用户音乐体验和互动质量
英伟达已完成对 AI 基础设施初创公司 Lepton AI 的数亿美元收购,该公司由 AI 领域专家贾扬清创办,专注于提供云端解决方案。此次收购将增强英伟达在云端 AI 计算市场的竞争力,并有望加速 AI 基础设施的创新
谷歌推出Sec-Gemini v1,一款专注于网络安全的人工智能模型,旨在通过结合实时网络安全知识与AI推理能力,提升安全运营流程效能,并在关键网络安全基准测试中显著超越现有模型。此创新性技术有望缓解网络安全领域攻防不对称的挑战,并通过开放合作加速AI在网络安全应用的发展
HiDream-I1,一款国产开源图像生成模型,以其17亿参数的强大技术底蕴,成为科技界新宠。该模型基于扩散模型技术,能够将文本描述转化为高质量图像,表现出优异的色彩还原和图像一致性。开发团队对技术的前沿把握和大规模预训练策略,实现了生成速度与质量的平衡。HiDream-I1的完全开源和MIT许可证授权,预示着其在开源AI领域的广阔前景,有望在国际舞台展现竞争力。尽管面临挑战,但其社区协作和持续迭
阿里云旗下人工智能大模型系列Qwen3取得重要进展,下一代模型Qwen3的相关支持已整合至vLLM代码库,预计将推出Qwen3-8B和Qwen3-MoE-15B-A2B两个版本,分别展示不同规模和架构的创新。Qwen3将为开发者提供高效推理能力,巩固阿里云在开源AI生态中的地位,并有望在多模态处理、性能表现等方面实现突破
ElevenLabs推出的MCP服务器实现了AI生态系统的升级,通过文本提示使AI助手能够直接访问其音频平台,提供统一的语音服务接口,并支持多种音频处理功能,包括语音转换、克隆和识别,以及语音代理功能
PokemonGym,一个专为评估AI代理在《宝可梦Red》游戏中的表现而设计的平台,引起了广泛关注。该平台允许开发者训练和测试AI算法,Anthropic的Claude模型已展示出接近人类玩家的游戏能力。PokemonGym为AI研究提供了新工具,并预示着游戏AI的未来发展潜力
Geekplus第四次荣获《机器人商业评论》2025年RBR50创新奖,与ABB、Nvidia等行业巨头并列,彰显其在机器人技术、商业影响及行业领导力的卓越成就。其SkyCube解决方案通过创新设计大幅提升存储密度和拣选效率,而机器人管理系统则能高效协调超过5000台机器人,为智能仓储领域树立新标杆
Cloudflare 发布了面向Node.js生态的Agents开发包,提供全面的AI代理开发基础设施,包含工作流引擎、工具集成框架、多代理协作平台及状态持久化支持。该开发包旨在简化AI代理构建与部署,增强自动化任务执行和智能决策能力,标志着Cloudflare在AI代理领域的深入探索
五菱汽车推出搭载灵语AI中枢大模型的“灵语座舱”,具备方言识别和智能调度功能,旨在消除语言交流障碍,提升用户智能驾驶体验,并推动智能汽车领域的发展
GitHub 开源全新MCP服务器,与GitHub API集成,提供高效工作流体验,支持自动化任务。该服务器由GitHub与Anthropic合作开发,增强易用性和功能,扩展MCP生态,预示AI与开发工具融合的深化趋势
Mozilla Builders 推出 LocalScore 工具,为本地大型语言模型提供基准测试,支持 Windows 和 Linux 系统,易于分发和使用。该工具基于 Llamafile 开发,能在 CPU 和 GPU 上评估模型性能,并通过 LocalScore.ai 存储库简化测试结果分享,助力 AI 技术发展
阿里巴巴宣布推进AI智能眼镜项目,由天猫精灵团队主导,计划推出超越Ray-Ban Meta的硬件产品。采用双芯片架构,优化性能,并将推出两款版本,重点开发带AR功能的版本。项目旨在整合阿里AI技术,提升用户体验,标志着阿里在AI与AR领域的战略布局,有望在智能眼镜市场与Meta竞争
新闻/媒体联盟呼吁美国政府介入,要求大型科技公司为使用其内容的人工智能产品支付费用。该联盟提出三项主要要求:公平补偿创作者、内容透明化及防止垄断行为。同时,OpenAI与该联盟成员之间的法律冲突持续存在,引发了行业对人工智能使用内容的关注和讨论
OpenAI 正在探讨收购由前苹果设计总监 Jony Ive 和首席执行官 Sam Altman 共同创立的 AI 硬件公司 io Products,该公司致力于开发无屏幕智能设备。此合作可能增强 OpenAI 在人工智能语音助手市场与苹果的竞争
谷歌宣布在AI模式下引入多模态搜索功能,允许用户对图像内容进行深入提问,实现智能推荐。该功能基于Google Lens技术,计划在未来几周内向数百万用户推广,并持续优化用户体验,以提升服务品质
Meta公司针对新AI模型Llama4的“不当训练”指控发表声明,坚决否认相关指控。公司副总裁艾哈迈德・阿尔・达赫勒澄清,测试集训练属于不正当竞争行为。尽管Llama4Maverick和Llama4Scout部分表现不如预期,Meta承认在LM Arena使用实验版本,但否认存在不诚信行为。公司强调其AI伦理标准可信,并提示AI模型版本差异可能影响性能
亚马逊升级其 AI 视频生成模型 Nova Reel 至 1.1 版本,实现最长两分钟的视频生成及多镜头制作功能。该模型支持基于提示生成多至20个镜头的视频,并引入 Multishot Manual 模式以提升镜头控制。尽管 Nova Reel 面临版权和知识产权的质疑,亚马逊承诺将保护客户免受相关诉讼影响
Meta新推出的Llama4模型中的Maverick和Scout在标准测试中表现出色,但在复杂长上下文任务中表现不足。Maverick在智能指数上领先Claude3.7Sonnet,但落后于Deepseek V30324,而Scout与GPT-4o-mini相当。两款模型在推理、编码和数学任务中表现稳定,价格实惠。然而,长上下文任务和格式优化问题成为其弱点,Meta对此表示正在优化并否认作弊指控
谷歌DeepMind在英国对AI员工实施严格竞业协议,限制离职后一年内不得加入竞争对手,引发行业对人才流动及职业发展影响的关注。员工在协议期间享有带薪休假,但微软AI副总裁透露有员工对此感到绝望。谷歌表示将选择性使用此类协议,但其对员工满意度和行业创新的潜在影响仍存争议
谷歌推出Gemini Live摄像头和屏幕共享功能,现已支持Pixel9系列及三星Galaxy S25设备。该功能通过AI聊天机器人提供实时环境信息,增强手机互动性,需订阅Gemini Advanced服务。支持45种语言,面向18岁以上用户
Shopify首席执行官托比・吕特克要求员工在寻求额外资源前,必须证明无法通过AI完成工作。此策略旨在促进AI融入工作流程,提升效率。吕特克强调,掌握AI技能已成为基本要求,并将AI应用纳入绩效评估,以实现专业技能与AI结合,优化商家服务
商汤科技宣布将于4月10日举办2025技术交流日,届时将推出全面升级的商汤大装置SenseCore,预计将显著提升AI基础设施及行业大模型应用能力,实现技术能力指数级增长。自2021年推出以来,SenseCore已成为整合全国算力资源的关键基础设施,为商汤及外部客户提供了强大的大模型研发支持
阿里国际计划在2026届校园招聘中大幅增加人工智能领域人才的招聘比例至80%,旨在强化其在AI技术的研发和应用能力。此举与公司对AI领域的深入投资和创新战略一致,并推出了“Bravo102”人才培养计划,采用创新的“人才反选”机制,以吸引和培养顶尖AI科技人才
Supabase推出官方MCP服务器,实现AI工具与数据库的无缝集成,提升开发者工作效率。该服务器支持超过20种功能,简化数据库操作流程,并计划未来增加更多高级功能。此举标志着Supabase在AI驱动的数据库管理领域的深入探索,为开发者和企业带来更低门槛和更高效率的数据库管理解决方案
上周,伦敦 Meta 总部外作家群体抗议公司未经许可使用其作品训练 AI,指责 Meta 盗用版权。《大西洋月刊》建立数据库供作者查证作品是否被利用。Meta 声称其行为合法,但作家们呼吁政府介入,强调版权保护重要性。此事件凸显了创作者对 AI 公司使用其作品的愤怒,相关法律争议正在多个法庭审理中
深思科技与清华大学合作,致力于降低AI模型训练成本,通过创新的强化学习方法提升模型训练效率。此举有望加速行业数字化转型,为各行业提供成本效益更高的AI解决方案