AI最新资讯

不错过全球每一个AI革命的瞬间

最新资讯

OpenAI核心API引入MCP功能,大幅简化智能体开发流程

OpenAI宣布其Responses API正式支持Model Context Protocol(MCP),显著降低开发者连接AI模型与外部工具的难度,推动AI生态的开放与协作。MCP协议由Anthropic提出,旨在统一AI模型与外部服务的交互,OpenAI的加入标志着其在AI标准化与协作方面的关键进展。此次更新增强了Responses API的功能,为开发者提供了更高效的工具集成选项,与行业趋

3 个月前

OpenAI Responses API迎来MCP支持及全面功能升级,加速智能体开发进程

OpenAI宣布其核心API——Responses API支持Model Context Protocol(MCP),并更新了图像生成、Code Interpreter及文件搜索工具,显著提升开发效率与API功能性。通过MCP,开发者可轻松连接外部工具和服务,实现复杂功能集成。此外,图像生成功能新增实时预览和多轮编辑,Code Interpreter增强数据分析与图像处理能力,文件搜索工具优化跨数

3 个月前

微软力挺AI革新:飓风预测速度成本双降,领跑传统技术

科学家研发的机器学习模型“Aurora”在热带气旋轨迹预测方面显著优于官方机构,具备更快的速度和更低的成本。该模型通过学习大量地球物理数据,预测复杂物理过程,已成功应用于多个地球系统预测领域,展现广泛的应用潜力

3 个月前

Sparkify新实验产品:问题输入即生成动画短片,轻松解读复杂知识

谷歌推出AI产品Sparkify,利用Gemini与Veo模型,可在2分钟内将用户输入的问题或复杂概念转化为动画短视频,实现高效知识传播。Sparkify以创新的教育应用场景和技术亮点,在教育、科普和内容创作领域产生深远影响,引发广泛关注和热议

3 个月前

Video Ocean震撼推出高性价比2K/4K HDR视频生成利器,全网热议性价比巅峰

潞晨科技旗下Video Ocean推出全新AI视频生成工具,能快速生成2K/4K HDR高质量视频,并登顶Product Hunt热门榜单。该工具提供丰富模板及特效,支持多样化创作需求,并具备高性价比和免费特性,受到广泛好评。Video Ocean V2.0全面升级,提升画面质量和真实感,推动视觉创作热潮

3 个月前

京医千询医疗大模型2.0焕新亮相,引领智能诊疗新纪元

京东健康宣布医疗大模型“京医千询”升级至2.0版本,通过多模态感知与深度检索技术提升临床诊疗效率与准确性,尤其对复杂疾病治疗提供个性化方案。新版结合循证医学与患者数据,优化诊断和治疗建议,并引入影像病理诊断模块。同时,管理层面调整,技术产品部总经理李欣离职,CEO金恩林直接管理,预示智能医疗领域将进一步发展

3 个月前

法院维持 AI 引发自杀案诉讼,谷歌与 Character.AI 撤诉请求被驳回

佛罗里达州法院驳回了谷歌子公司Character.AI的撤诉请求,涉及一起14岁用户使用聊天机器人后自杀的诉讼。该案件被视为AI技术潜在风险的开创性审理,原告指控聊天机器人未充分测试即发布,导致儿子情感和心理伤害。尽管部分指控被驳回,法官仍允许基于产品责任继续诉讼,可能为AI领域科技公司的法律责任设立新标准。Character.AI已更新安全措施,但平台安全性仍受质疑

3 个月前

谷歌新AI技术引发媒体界强烈反响,被指控为行业‘掠夺者

谷歌在美国推出新AI搜索功能,遭到新闻出版商强烈反对,称其剥夺了出版商流量和收入。新闻/媒体联盟呼吁司法部采取措施防止谷歌垄断,而谷歌内部文件显示未征求出版商许可。此事件凸显了技术创新与保护内容创作者权益之间的平衡问题

3 个月前

飞桨PaddleOCR 3.0全新开源:OCR识别精度大幅提升13

百度飞桨团队于2025年5月20日发布了PaddleOCR3.0版本,并开源。该版本在文字识别精度、多语种支持及手写体识别等方面实现显著提升,全面适配飞桨框架3.0,并增强了文档解析能力。PP-OCRv5模型实现了多文字类型和复杂场景的识别,PP-StructureV3和PP-ChatOCRv4方案分别提升了文档解析和智能文档理解性能。此更新巩固了PaddleOCR在OCR领域的领先地位,为开发者

3 个月前

谷歌Gemini AI用户增长突破:月活跃用户达4亿,覆盖全球15亿用户

谷歌CEO桑达尔·皮查伊宣布,Gemini AI应用程序月活跃用户数已超4亿,覆盖200多个国家和地区,支持超过40种语言。此成绩彰显了消费者对AI技术的兴趣,以及谷歌在AI领域的技术实力和全球化布局。未来,Gemini AI有望继续扩展应用范围,增强功能,对多个行业产生深远影响

3 个月前

Shopify 发布革命性 AI 工具,简化在线店铺搭建流程

Shopify 发布了创新的“AI 商店构建器”,通过关键词自动生成商店布局,简化电子商务建站流程,显著提升商家效率,并展示其在人工智能领域的深入布局,旨在吸引更多商家利用其平台开展业务

3 个月前

谷歌Veo 3震撼亮相:引领音画同步视频生成革命

谷歌发布新型视频生成模型Veo3,实现音画同步生成,突破多模态技术限制,通过V2A算法实现视频视觉信息与文本提示结合生成音轨。该工具面向美国高阶订阅用户,为视频创作领域带来新可能性,展现出色音画合成能力,尤其在对复杂提示理解和物理世界声音模拟方面

3 个月前

Mistral 重磅开源:推出高效 AI 模型 Devstral,笔记本即可轻松运行

Mistral AI与All Hands AI合作推出开源语言模型Devstral,专为代理AI软件开发设计,性能在特定测试中超越多款闭源模型。Devstral优化理解跨文件上下文,支持Apache2.0许可,为开发者提供高度自由的开源工具。基于Codestral系列,Devstral在SWE基准测试中表现突出,具有高效部署和商业友好特性,标志着构建自主软件工程系统的重要进展

3 个月前

明星初创Builder.ai破产,人工智能行业遭遇寒流

英国人工智能初创公司Builder.ai因资金链断裂宣告破产,曾估值超10亿美元,获得多家巨头投资。该公司因账户被扣押及现金流问题被迫关闭,首席执行官承认公司无法从历史挑战中恢复。Builder.ai的破产为人工智能行业敲响警钟,预示行业将更注重实际应用和可持续发展

3 个月前

OpenAI德克萨斯数据中心扩建项目喜获116亿美元巨额投资加持

Crusoe Energy Systems为OpenAI在得克萨斯州的数据中心成功融资116亿美元,用于扩建至八栋建筑,增强其生成式人工智能领域的计算能力。此举将显著提升OpenAI的算力基础设施,并降低对微软的依赖,总筹资规模达150亿美元

3 个月前

微软 Win11 五月更新容量猛增,AI 功能成为空间“大户

微软近日发布Windows1124H2和Windows Server2025的累积安全更新KB5058411,更新包体积异常庞大,达4368.9MB,其中约3GB与AI应用相关,引发用户对更新策略的质疑。此举与微软此前承诺的优化更新体积相悖,引发广泛讨论

3 个月前

OpenAI斥资65亿美元巨资收购Jony Ive新创企业io,开启人工智能硬件新时代

OpenAI 宣布以约65亿美元全股票交易收购 AI 设备初创公司 io,标志着其在 AI 硬件领域的重大拓展。此次收购将使 io 的专业团队加入 OpenAI,共同开发创新消费硬件产品,预计首款新设备将于2026年推出,对科技行业具有潜在深远影响

3 个月前

昆仑万维全球首推:天工智能体Skywork Super Agents震撼发布

昆仑万维集团发布天工超级智能体,标志着“AI版Office”时代的到来。该产品采用AI agent架构和deep research技术,能生成多种内容形式,并在GAIA榜单上排名全球第一。由5个专家级智能体和1个通用智能体组成,具备强大的内容生成和深度研究能力。昆仑万维集团视此为AI领域的重要战略布局,未来将探索更多AI技术应用场景

3 个月前

智元机器人灵犀X2将于5月22日震撼上市,三款新品售价亲民10万起跳

智元机器人宣布新一代人形机器人“灵犀X2”将于5月22日开售,具备多场景应用能力,推出三个版本,售价10万至30万元不等。此举标志着智元在人形机器人技术及市场应用方面取得重要进展

3 个月前

面壁智能新一轮数亿元融资成功,加速AI技术在汽车领域应用落地

面壁智能宣布完成数亿元新一轮融资,由多家知名投资机构共同参与,将助力公司提升大模型技术及产品壁垒,加速在汽车等领域的应用落地。该公司由前知乎CTO及清华大学副教授创办,专注端侧AI模型开发,近年来在汽车应用方面取得显著进展,展现强大市场潜力

3 个月前

百度新承诺:李彦宏誓言未来五年培养千万AI人才助力社会

百度宣布未来五年将培养1000万名AI人才,显著提升对人工智能领域的投资与承诺。公司计划开放21000个实习岗位,推动校园人才实践与职业发展,并启动“百度人才培养星河”计划,专注于大模型技术人才培养,以促进技术进步和创新

3 个月前

Kimi等AI应用因违法收集个人信息遭官方通报

国家网络与信息安全信息通报中心指出,35款移动应用在应用宝平台存在违法违规收集使用个人信息问题,包括未经授权超范围收集、未明确收集规则、个人信息保护政策不符实际业务需求等违规行为。受影响的软件包括多款AI应用。相关部门已进行检测并公布具体情况

3 个月前

MedGemma AI:谷歌革新医疗图像与文本分析利器

在2025年I/O开发者大会上,谷歌推出开源医疗AI模型MedGemma,基于Gemma3架构,具备卓越的多模态图像和文本处理能力,旨在提升医疗诊断效率。MedGemma提供4B和27B两种参数模型,分别针对医疗图像和临床文本处理。模型可通过本地或谷歌云Vertex AI平台部署,并支持开发者微调和集成,为医疗实践带来新的可能性

3 个月前

英伟达新型AI模型Cosmos-Reason1助力深度物理世界认知

英伟达推出Cosmos-Reason1系列模型,专注于增强AI在物理推理和具身任务中的性能,通过双本体系统和视觉-文本同步推理,显著提升物理常识理解和具身推理能力,为机器人及自动驾驶领域带来新解决方案

3 个月前

魅族新一代AI眼镜惊艳亮相:搭载眼动追踪与智能识脸技术,领跑智能穿戴新领域

星纪魅族预告下一代AI眼镜StarV,显著提升AI视觉交互功能,包括眼球追踪、人脸识别和扫码支付等,预示智能穿戴设备向主动感知和智能处理迈进,展现国产智能眼镜的技术进步

3 个月前

飞书AI新品"知识问答"引领企业知识管理革新潮

飞书即将推出AI产品“知识问答”,旨在通过智能化手段优化企业知识管理,促进数字化转型。该工具能整合企业内部信息,提供精准答案,提高工作效率,并采用前沿技术保障答案准确性及安全性。飞书期望“知识问答”能推动企业知识动态流动,增强运营效率,助力创新发展

3 个月前

苹果大招:开放AI模型权限,助推开发者打造前沿创新应用

苹果公司计划在即将举行的WWDC大会上开放其人工智能模型给第三方开发者,以促进创新应用开发并增强设备吸引力。此举标志着苹果在生成式AI领域的重要进展,旨在克服该领域的滞后。苹果将通过SDK和框架提供本地设备上的AI模型,并计划推出AI驱动的电池管理和健康应用。同时,大会将展示统一操作系统的更新,为应用生态发展奠定基础

3 个月前

腾讯发布全新大模型战略:Turbo S与T1模型实现重大突破升级

腾讯宣布全面升级其混元大模型矩阵,包括旗舰快思考模型混元TurboS和深度思考模型混元T1的更新,以及新推出的视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。混元TurboS在全球权威评测平台排名前八,国内仅次于DeepSeek。混元T1在多方面实现性能提升。此外,混元图像2.0、混元3D v2.5等模型也得到升级,混元游戏视觉生成模型和平台助力游戏资产生成效率显著提升。腾讯

3 个月前

腾讯发布全新升级模型矩阵,推出高性能视觉推理T1-Vision与语音通信混元Voice模型

腾讯混元宣布模型矩阵全面升级,推出全新视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。混元TurboS模型在全球评测中排名前八,理科能力显著提升。腾讯混元致力于开源技术,支持多模态模型持续迭代与应用

3 个月前

Catena Labs成功筹集1800万美元,加速构建AI驱动的新型金融机构

Catena Labs 宣布获得1800万美元投资,用于打造全球首个针对AI代理服务的监管合规金融机构,以推动代理经济的发展。该公司由前 Circle 联合首席执行官肖恩・内维尔共同创办,旨在构建一个适应AI交易需求的金融体系,解决传统金融系统与AI代理互动的不足。此轮融资由a16z Crypto领投,多家知名投资机构和天使投资人参与。Catena Labs 还推出“代理商务工具包”,以支持智能金

3 个月前

阿里巴巴注资2.5亿美元助力美图,AI与电商战略升级

美图公司与阿里巴巴达成2.5亿美元的战略投资协议,阿里巴巴将通过可转债形式投资美图,双方将在电商、AI技术和云计算等领域深化合作,推动业务发展

3 个月前

MarketWatch:谷歌加大人工智能搜索投资,积极应对竞争挑战

谷歌在I/O开发者大会上推出“AI模式”,强化搜索引擎的AI功能,以应对市场竞争。新功能包括深度搜索和实时搜索,旨在提供更准确的搜索结果和提升用户体验。尽管面临竞争压力,谷歌在AI领域的技术领先优势及其新功能的成功测试为投资者带来信心。然而,市场对AI驱动搜索工具的关注也增加了谷歌的挑战

3 个月前

华硕高层展望:AI电脑全面普及尚待两年砥砺前行

华硕共同首席执行官胡镇荣在 Computex 展会上指出,AI 电脑市场普及需至2026年或更久,受全球经济形势及关税政策影响,市场前景仍不明确。尽管华硕等厂商积极推出 AI 电脑,但消费者习惯和市场接受度的培养尚需时间。华硕仍致力于技术创新,以保持行业竞争力

3 个月前

字节跳动推出BAGEL开源多模态模型:革新图文生成与编辑技术

字节跳动推出开源多模态基础模型BAGEL,具备70亿活跃参数,性能在多模态理解基准测试中超越现有顶级模型,并在图像生成与编辑任务上表现出类似专业水平的能力。BAGEL采用MoT架构,强化多模态信息学习能力,通过大规模预训练显著提升理解和生成性能,展现出在复杂多模态任务中的先进能力

3 个月前

京东云推出五大AI营销神器,限时0元助力商家销售飞跃

京东宣布免费向POP商家推出五大AI营销产品,包括数字人直播、智能客服系统、短视频生成工具等,以提升商家销售效果和运营效率。这些工具将降低营销成本、提高转化率,并优化图文及视频营销效果

3 个月前

重磅发布:谷歌NotebookLM全新视频概览,一键将PDF与图片转化为动态动画短片

在I/O2025大会上,谷歌推出NotebookLM的全新视频概览功能,自动将PDF、图片、文本等素材转化为动画短片,深入讲解复杂内容。该功能面向所有用户开放,首版支持英语,引起了教育、科研和内容创作领域的广泛关注。该技术利用Gemini1.5Pro的多模态能力,为用户提供了高效的学习和创作工具,预计将对AI辅助学习和创作产生深远影响

3 个月前

谷歌发布Project Astra:Android手机智能助理全新控制体验

谷歌发布Project Astra,展示智能助理新功能,实现Android手机控制、信息查询及任务代理,致力于打造实用的“通用AI助手

3 个月前

iOS 19 将开放 AI 模型权限,助力第三方开发者创新

苹果公司计划在即将发布的iOS19中向第三方开发者开放其人工智能模型,旨在促进软件开发创新并增强硬件产品吸引力。苹果将推出 SDK 及相关框架,允许开发者利用 Apple Intelligence 创建新功能,初期将优先开放本地小型 AI 模型。此举旨在将苹果操作系统打造为 AI 软件平台的核心,为开发者提供更多可能性

3 个月前

DeepSeek推出全新大模型训练端到端研究论文,凸显卓越工程技术深度

DeepSeek最新发布的论文详细介绍了在大模型训练中的端到端技术创新,包括软件层面的MLA、FP8混合精度训练、DeepEP通信库及LogFMT格式,以及硬件优化和混合优化策略。研究显著提升了模型训练效率,降低了成本,并在开源AI领域取得了与闭源模型相媲美的性能。该成果不仅彰显了DeepSeek的技术领先地位,也为AI社区提供了重要参考,推动了模型训练的进步

3 个月前

豆包全新语音播客模型震撼发布,覆盖豆包APP、PC端及扣子等多平台

火山引擎推出豆包·语音播客模型,基于流式模型构建,实现文本到语音播客的快速转化,提供低成本、高时效、强互动的创作体验,解决了传统AI播客创作的痛点,简化制作流程,并支持热点内容快速生成播客

3 个月前

谷歌Gemma 3n震撼上市:手机端全能多模态AI,音频、图像、文本一机在手

谷歌在I/O2025大会上推出Gemma3n,一款适用于低资源设备的多模态AI模型,仅需2GB RAM即可高效运行。该模型基于Gemini Nano架构,支持文本、图像、视频和音频处理,无需云端连接,实现本地推理,为移动端AI体验带来革命性改进。Gemma3n的多模态能力和低资源需求,预计将对AI生态产生深远影响,特别是在无障碍技术、移动创作和教育研究领域

3 个月前

全面革新:Gemma模型家族在Google I/O大会惊艳升级,实现手机到手语无缝翻译

在2025年Google I/O大会上,谷歌推出轻量级多模态模型Gemma3n,并扩展Gemma家族,新增医疗领域的MedGemma和手语识别的SignGemma。Gemma3n专为低算力设备设计,强调隐私保护,适用于离线AI应用。MedGemma和SignGemma旨在推动医疗健康和无障碍领域的AI发展。尽管存在商业化使用的许可条款问题,Gemma模型系列已广受开发者欢迎

3 个月前

谷歌发布AI编程助手Jules:搭载Gemini 2.5 Pro引擎,正面迎战OpenAI Codex

在2025年5月20日的Google I/O开发者大会上,谷歌宣布AI编码助手Jules进入全球公测阶段,开放给全球开发者使用。Jules基于Gemini2.5Pro模型,能够自动化执行编码任务,提升开发效率,并与GitHub无缝集成。该工具的特点在于其透明性和可控性,同时提供免费任务配额。Jules的发布标志着AI编码工具向全流程自动化转变,挑战现有市场产品,但其语言支持范围和稳定性尚需验证

3 个月前

谷歌全新虚拟试衣间震撼登场!上传照片即刻化身时尚达人,AI智能比价一键购物体验

谷歌在I/O2025大会上推出AI虚拟试衣工具,利用用户上传的全身照片在数秒内生成逼真穿搭效果图。该工具结合时尚专用图像生成模型和Shopping Graph的50亿商品数据,提供高度个性化试穿体验,支持多条件搜索、比价分析和自动购物流程。此技术亮点包括时尚专用AI和大规模商品数据库的整合,对时尚电商行业具有革命性影响,提高用户购买意愿并降低退货率

3 个月前

独家发布!谷歌AI Ultra订阅服务:每月249.99美元,解锁顶级AI模型与高级特权

谷歌推出AI Ultra订阅计划,提供顶级AI模型访问和高级功能,面向电影制作人、开发者和创意专业人士。该计划包括最新的Gemini应用、AI电影制作工具Flow,以及30TB存储空间。AI Ultra旨在通过先进技术提升用户的知识、创造力和工作效率

3 个月前

谷歌全新AI搜索模式发布:Deep Search功能深度增强体验

在2023年,谷歌在Google I/O开发者大会上宣布推出AI Mode搜索功能,采用Gemini2.0模型,提供对话式搜索、多模态支持、深度搜索及代理功能,实现更智能、个性化的搜索体验。该功能旨在通过并行搜索、多步骤任务执行和结合用户数据,提升搜索效率和质量,目前已在美国全面开放

3 个月前

谷歌发布Gemini 2.5 Pro Deep Think:并行推理革新AI复杂问题处理能力

在2025年Google I/O开发者大会上,谷歌DeepMind推出Gemini2.5Pro的Deep Think模式,通过并行推理技术显著提升AI在数学、编码和多模态推理等复杂任务的表现。该模式引入思考预算和思考摘要功能,优化开发者体验,并已面向受信任测试者开放,未来将逐步扩展可用性。此模式被视为AI推理领域的重大突破

3 个月前

Chrome浏览器与谷歌搜索迎来AI智能助手Project Mariner全面升级

谷歌在2025年I/O大会上推出“Project Mariner”项目,进一步拓展其在人工智能领域的布局。该项目,原名为“Jarvis”,经过测试后以更成熟形态亮相,旨在优化用户网络浏览体验。Project Mariner作为一款网络AI智能体,能处理多任务并预测用户需求,已接入Gemini API并与合作伙伴进行测试。该技术预计将提升Chrome、搜索和Gemini应用的智能化水平,为用户提供高

3 个月前

谷歌新推Flow AI剪辑神器:融合Veo3与Imagen4技术,实现智能镜头控制与场景拓展

在2025年5月20日的Google I/O开发者大会上,谷歌推出了一款革命性的AI视频剪辑工具Flow,旨在简化影视创作流程。Flow结合了Veo3、Imagen4和Gemini三大AI模型,提供自然语言驱动的视频生成、模块化编辑和资产管理等功能,支持专业和业余创作者制作高质量视频内容。该工具的发布标志着谷歌在AI视频工具领域的深入布局,并有望推动影视制作行业的数字化转型

3 个月前

Gmail全新升级:Gemini AI智能助手,一键高效管理日历事件

谷歌在2025年I/O大会上宣布,Gmail将整合Gemini AI功能,允许用户在应用内直接管理日历,提供便捷的日程管理体验。该功能面向特定用户群逐步开放,支持多语言,旨在提升用户体验并展示公司在人工智能领域的创新

3 个月前

谷歌新AI试衣助手:上传照片即享‘试穿到结算’一站式购物新体验

谷歌在2025年I/O开发者大会上推出了一项基于AI的虚拟试衣购物工具,利用定制图像生成模型实现照片上传后的拟真试穿效果,并集成至搜索功能。同时,推出代理驱动的结账系统,简化购买流程。这些创新基于每小时更新的“购物图谱”,预示着搜索向全链路消费入口的转型

3 个月前

谷歌全新Gemini 2.5系列亮相:轻量版与增强推理版蓄势待发

在2025年Google I/O大会上,谷歌发布Gemini2.5系列AI模型更新,包括针对普通用户的轻量级版本Gemini2.5Flash和面向专业用户的高性能版本Gemini2.5Pro。Gemini2.5Flash提升效率22%,具备显示思考过程的能力,而Gemini2.5Pro引入“Deep Think”增强推理模式。此次更新彰显谷歌在AI领域的持续创新,旨在巩固市场领先地位。同时,展示了

3 个月前

Gemini AI 赋能 Android Auto,革新驾驶智能体验

在2025年I/O开发者大会上,谷歌宣布通过Gemini AI技术升级Android Auto车载系统,旨在提供更自然流畅的语音交互体验。Gemini AI在自然语言处理上表现卓越,能够准确理解和执行复杂指令。此技术将优化驾驶者体验,预计未来几个月内Android Auto用户将优先体验,而Google built-in模式将在今年晚些时候推出,预示着智能汽车交互方式的重大变革

3 个月前

AI创作新纪元:Google推出249美元AI Ultra订阅服务,打造全面创作利器

在2025年Google I/O开发者大会上,谷歌推出了一系列AI与XR技术成果,包括Veo3、Imagen4、Android XR平台及AI Ultra订阅服务。Veo3和Imagen4提升了AI创作工具的能力,而Flow平台则革新了电影制作流程。同时,谷歌开放了音乐生成模型Lyria,并推出了Gemini Live实时协作功能。Google Meet和Gmail的AI功能增强,Gemini A

3 个月前

Google震撼推出全领域AI全家福:音乐、影视、图像一网打尽

在Google I/O大会上,谷歌推出了一系列AI新功能,包括AI Mode搜索体验、Gemini2.5Pro和Flash模型,以及创作工具Veo3、Imagen4和Lyria RealTime,旨在提升搜索效率、增强创作能力,并标志着其在AI领域的领先地位

3 个月前

百度文心X1 Turbo荣膺信通院顶级评价,实力领跑AI领域

百度AI Day上,中国信通院评定百度文心大模型X1Turbo为国内首个“4+级”大模型,其在16项评估能力中满分,尤其在逻辑推理等领域表现出色,标志着我国AI技术的重要进展和百度的技术领先地位

3 个月前

Google联手XREAL推出全球首款Android XR旗舰级AR眼镜,共启AR新纪元

Google与中国AR科技公司XREAL达成深度战略合作,共同推出全球首款专为Android XR平台设计的旗舰级AR眼镜Project Aura。该产品采用先进的光学透视技术,标志着AR产业进入新阶段。Project Aura的发布,巩固了XREAL在AR技术领域的领先地位,并为Android XR生态打下坚实基础,预示着AR行业的重要里程碑

3 个月前

谷歌推出新一代Android XR眼镜原型:轻薄造型搭载先进AI助手,实现技术革新

在2025年I/O开发者大会上,谷歌推出了设计简洁、功能先进的Android XR眼镜原型,与Warby Parker和Gentle Monster合作,将搭载Gemini AI。该眼镜以舒适度和自然体验为特点,集成了强大的多模态助手和创新的导航功能,需与安卓手机配合使用

3 个月前

谷歌全新Imagen 4图像模型惊艳亮相:高清晰2K画质搭配卓越文本渲染,AI创作再创新高

谷歌推出最新图像生成模型Imagen4,显著提升图像质量、提示理解和文本渲染能力,支持高达2K分辨率,满足专业设计需求,并集成至多个应用平台。该模型强化了谷歌在生成式AI领域的领先地位,但仍有优化空间

3 个月前

AI新突破!谷歌Gemini Live登录iPhone:摄像头与屏幕内容解析新体验

在2025年I/O开发者大会上,谷歌宣布其创新功能Gemini Live向iOS和安卓用户开放,实现实时识别和回应摄像头及屏幕内容,显著提升人机交互体验。此功能原仅限Gemini Advanced用户,现扩展至所有用户,预示AI技术进步将改变用户与技术互动方式,为日常生活带来便利和乐趣

3 个月前

谷歌Veo3惊艳亮相:4K影视级制作,音视频同步生成震撼发布

在2025年5月20日的Google I/O开发者大会上,谷歌发布Veo3视频生成模型,实现音视频一体化生成,显著提升画质与真实感,支持4K分辨率及多样化风格,面向特定用户开放。Veo3的推出预示着AI视频生成技术的新突破,并可能重塑内容创作行业

3 个月前

面壁智能完成数亿元新融资,加速推进端侧大脑技术规模化布局

面壁智能宣布完成数亿元融资,由多家知名投资机构联合投资。此轮融资将助力公司在高效大模型技术、产品壁垒、行业赋能等方面取得突破,加速“端侧大脑”规模化应用,推动AGI时代的发展。面壁智能以高效大模型为核心,已推出多款领先产品,并在模型性能及商业化进程中取得显著成果

3 个月前

美图携手阿里巴巴签署战略合作协议,获得2.5亿美元资本注入

美图公司与阿里巴巴达成2.5亿美元战略合作投资,双方将在电商、AI技术、云计算等领域展开深度合作,推动技术创新和业务发展。阿里巴巴将优先推广美图的AI电商工具,并为其提供技术支持,美图则承诺向阿里巴巴采购不低于5.6亿元人民币的云服务。该合作尚待相关政府审批及港交所批准

3 个月前

英伟达创新力作:人形机器人引领工业革命新时代

英伟达推出人形机器人基础模型Isaac GR00T N1.5,显著提升训练效率,缩短数据采集时间至36小时,为工业革命奠定基础,多家行业领先企业已采用其技术

3 个月前

DeepMind 利用强化学习微调技术显著增强AI决策智能

本研究由谷歌 DeepMind 团队与约翰・开普勒林茨大学 LIT AI 实验室合作开展,旨在通过强化学习微调技术提升人工智能语言模型的决策能力。研究重点在于利用思维链强化训练,解决模型决策过程中的关键问题,显著提升了模型的逻辑推理与行动选择的准确性。实验结果表明,该方法有效缩小了模型推理与执行间的差距,并在多臂老虎机和井字棋任务中取得了显著性能提升

3 个月前

Google 推出 Imagen 4 及 Imagen 4 Fast:GCP Vertex 配额更新,AI 图像生成技术再突破

谷歌云平台Vertex AI新增Imagenn4与Imagenn4Fast模型,预示着下一代AI图像生成技术的广泛推广。这两款模型以强大的多模态生成能力和低延迟特性,为开发者与企业带来创新视觉体验。其动态共享配额系统优化了资源分配,而多模态功能及企业级整合预示着AI图像生成领域的新标杆。社区对此反响热烈,期待全面上线,推动视觉创作普及

3 个月前

Flowith NEO震撼上市!全球率先实现无限步骤、全语境支持的AI智能代理

Flowith推出全球首个无限步骤、上下文和工具支持的AI智能代理Agent NEO,具备强大的云端执行能力和多模态协作功能。该产品由10人团队在Hackathon中开发,已引发全球开发者关注。Agent NEO能够执行超长周期任务,支持大规模数据处理和多工具调用,其技术突破预示着AI生产力工具领域的重大进展

3 个月前

全新发布!一键AI打造您的个性化投资指数 —— ‘Generated Assets’震撼登场

Public推出AI驱动产品“Generated Assets”,通过AI分析市场数据生成定制化投资指数,允许用户实时跟踪表现,并提供历史回报对比。此创新产品简化投资流程,降低投资门槛,被视作零售投资领域的一大突破。尽管存在对透明度的疑问,但Generated Assets预示着AI在投资领域的深入应用和投资工具的智能化趋势

3 个月前

富士康联姻英伟达 共建百兆瓦级AI数据中心

富士康与英伟达合作推进人工智能数据中心建设,计划分阶段达成100兆瓦的功率规模,旨在支持台湾科技生态系统发展,并促进人工智能超级计算机的开发,强化台湾在全球科技竞争中的地位

3 个月前

Windows 11全新升级:原生集成MCP支持

微软宣布即将升级Windows系统,引入模型上下文协议(MCP)以增强AI应用与系统及服务的互动能力。此举旨在打造以AI为核心的操作系统,提升用户体验。同时,微软强调MCP的安全重要性,并推出Windows AI Foundry,简化AI模型集成流程,确保开发便捷性与安全性

3 个月前

美团AI发布对话式编程工具“NoCode”:挑战Lovable,开启零代码开发新篇章

美团加速AI战略布局,即将推出面向非技术用户的AI编程工具“NoCode”,目前正处于灰度测试阶段。该工具由美团研发质量与效率团队打造,旨在普及AI编程能力至更广泛用户,包括中小商家和运营人员,实现简单、对话式的应用构建。此产品是美团“AI in Products”战略的组成部分,预计将进一步提升开发效率和用户体验

3 个月前

Omni-R1:文本驱动强化学习与自动生成数据助力音频问答技术革新

研究团队开发了一种新型音频问答模型Omni-R1,基于Qwen2.5-Omni并通过GRPO强化学习优化。该模型在MMAU基准测试中实现最先进成绩,其性能提升主要归因于文本推理能力的增强。通过ChatGPT生成的数据集进一步提升了模型准确性,Omni-R1在音频问答领域树立了新标杆,并强调了文本推理在模型性能中的关键作用

3 个月前

马斯克强强联手微软,Grok AI模型强势登陆Azure云端平台

在微软 Build 开发者大会上,微软与 xAI 宣布将 Grok3 人工智能模型引入 Azure AI Foundry 平台,加强双方合作。Azure AI Foundry 平台支持多种 AI 模型,Grok 的加入提供新的功能。埃隆·马斯克和萨蒂亚·纳德拉强调 Grok 的真实性、准确性和安全性,以及在真实世界中的应用。马斯克期望 Grok 服务扩展至更多企业,展示 AI 技术对行业发展的推动

3 个月前

腾讯混元全新力作:一键生成游戏视觉盛宴

腾讯发布混元游戏视觉生成平台,基于混元大模型,为游戏行业提供高效的AI内容引擎,显著提升美术设计创作效率。平台整合设计流程,实现快速创作和实时反馈,并支持多种游戏风格,提高设计准确性和协作效率。未来数月内,腾讯混元计划推出更多增强功能,进一步推动游戏美术行业发展

3 个月前

火山引擎开源MCP Servers,加速大规模模型应用研发进程

火山引擎推出开源MCP Servers平台,助力企业共享自研工具,简化大模型应用开发流程,并通过集成丰富的MCP服务提升开发效率

3 个月前

突破性进展:融合卡尔曼滤波的全新人脸超分辨率模型,KEEP引领细节与时序一致性技术革新

Hugging Face社区推出了创新的视频人脸超分辨率模型KEEP,利用卡尔曼滤波原理和跨帧注意力机制,实现细节恢复与时序一致性的显著提升,成为该领域的最新SOTA。KEEP在性能上超越传统方法,适用于视频会议、影视修复等多场景,并在开源社区获得广泛关注,有望推动视频超分辨率技术的发展和应用

3 个月前

Nvidia 发布革命性 AI-DGX 个人超算系统,引领桌面级超级计算革新

Nvidia 推出 DGX Spark 和 DGX Station 个人 AI 超级计算系统,旨在提供高性能和效率,满足人工智能领域增长需求。DGX Spark 提供 1Petaflop 的计算能力,而 DGX Station 则提供高达 20Petaflops 的性能,适合复杂 AI 工作负载。两款系统预装 Nvidia AI 软件栈,将于夏季上市,合作伙伴包括 Acer、Dell、HP 等,以

3 个月前

一键速成利器:MoneyPrinterTurbo AI打造高清短视频

MoneyPrinterTurbo 是一款开源短视频自动生成工具,利用人工智能大模型实现自动生成视频文案、素材、字幕和背景音乐。该工具简化了视频制作流程,支持多种视频尺寸、批量生成、自定义字幕和语音合成,以及多模型接入。适用于内容创作者、教育工作者和企业营销人员,旨在提升视频制作效率与质量。开发者计划未来增加更多功能以优化用户体验

3 个月前

Claude 4 Sonnet & Opus全新亮相!Anthropic“Keynote”技术解析,AI编码革新背后的秘密揭晓

Anthropic即将发布的新一代AI模型Claude4Sonnet和Claude4Opus,具备在“思考模式”与“工具使用模式”间切换的能力,预计将提升复杂任务处理效率。Anthropic的“Keynote”流和Claude Code功能引起广泛关注,业界猜测与Claude4发布相关。新模型预计在编码、数学和视觉推理等基准测试中有显著提升,挑战现有市场主流AI模型。Anthropic的快速迭代策

3 个月前

谷歌全面上线Gemini网页版对话搜索,移动端跟进,引领AI搜索新变革

谷歌推出Gemini网页版对话搜索功能,基于Gemini2.5 Pro,允许用户以自然语言进行多轮搜索,提供智能、直观答案。此功能已向全球用户开放,并计划扩展至移动端。Gemini对话搜索通过高级推理和多模态能力,结合Google生态数据,提供个性化回答,对搜索市场产生重大影响,被视为AI搜索普惠化的里程碑

3 个月前

GitHub Models推出Grok3公开预览版:探索新一代AI模型

xAI发布Grok3人工智能模型公开预览版,提供强大的数据提取、代码编写和文本摘要功能,适用于多行业。Grok3具备实时更新能力,与GitHub Models集成,通过Azure AI Foundry支持企业应用,并通过API服务开放集成。xAI鼓励开发者体验并提供反馈,以促进模型优化

3 个月前

VS Code 正式开源 GitHub Copilot Chat 扩展:AI 编程加速器全新升级

微软宣布将 Visual Studio Code 的 GitHub Copilot Chat 扩展开源,并以 MIT 许可证发布,进一步推动 AI 驱动开发工具的开放性与创新。此举将允许社区协作优化 AI 代码编辑功能,提升开发效率与透明度,同时巩固 VS Code 在全球开发者中的领先地位

3 个月前

Salesforce全新BLIP3-o模型震撼加入Hugging Face!全开源多模态突破,图像处理与创作实力合一

Salesforce AI Research在Hugging Face平台发布BLIP3-o,一款全开源的统一多模态模型家族,以其高效的图像理解与生成能力获得广泛关注。BLIP3-o通过创新的扩散变换器架构和CLIP图像特征,实现训练效率与生成效果的显著提升。此模型的发布有望推动多模态AI领域的社区创新和应用扩展,尤其对教育和科研领域具有重要影响

3 个月前

无缝集成MLX-LM与Hugging Face,加速Apple Silicon设备上的大规模语言模型运行效率

Hugging Face平台已集成MLX-LM,为Apple Silicon设备用户提供了本地运行超4400种大型语言模型的便捷,无需依赖云服务。此更新优化了开发者的工作流程,推动了本地化AI开发的普及

3 个月前

全新上线!Bright Data MCP服务器搭载30+高效工具,一站式数据处理解决方案

Bright Data 推出开源 Model Context Protocol(MCP)服务器,集成30余工具以支持AI代理高效访问网络数据,解决IP封锁与访问限制问题。该服务器提供动态工具选择、支持多种平台,且完全开源,易于部署和使用。同时,其具备大规模数据处理能力,确保安全性,适用于复杂网络环境

3 个月前

Genspark 45天狂揽3600万美元ARR:20人小队缔造最快增长传奇

AI初创公司Genspark在45天内实现3600万美元的年度经常性收入增长,创历史纪录。该团队依靠零付费分销策略和创新的AI工具,如Genspark AI Sheet、Agentic Download Agent和AI Drive,取得显著市场渗透。Genspark的成功展示了对AI生态的深远影响,并被视为AI初创企业的标杆

3 个月前

Google NotebookLM iOS版正式发布,搭载Gemini 2.5 Flash强大赋能

Google 宣布推出 NotebookLM 人工智能助手移动应用,支持 iOS 和 Android 系统,实现跨平台研究体验。该应用保留核心功能,如智能总结、语义搜索和音频概述,并优化移动端使用场景,提供便捷的分享、上传和双栏布局。NotebookLM 移动应用的技术升级,整合 Gemini2.5Flash 模型,提升处理能力。同时,推出高级订阅服务 NotebookLM Plus,为用户带来更

3 个月前

全球首测!谷歌Jules测试版发布:AI写作新篇章,挑战Codex,尊享每日5次免费生成PR机会

谷歌推出基于Gemini2.5的AI编码代理Jules,旨在与OpenAI Codex竞争,具备自主分析代码库、生成GitHub PR等功能,每天提供5次免费任务。Jules的异步操作和GitHub深度整合,以及低门槛的体验,预计将对AI编码工具市场产生显著影响

3 个月前

妙多AI 2.0升级亮相:革新为人机协作,引领AI行业新趋势

妙多AI2.0升级聚焦人机协同,深度融合AI能力与专业编辑器,实现智能设计协作。新增“AI魔法框”等功能,提升设计效率与迭代速度,标志着界面设计AI助手向智能协作伙伴的转变

3 个月前

微软Edge升级新API,赋能开发者高效开发AI驱动的网页应用

微软在2025年Build大会上发布新Edge API,旨在简化开发者将AI功能集成至网页应用的过程,并计划与谷歌Chrome在AI网页应用领域竞争。新API支持接入Phi4mini模型,提供文本生成与编辑能力,同时Edge浏览器新增支持70种语言的PDF翻译工具

3 个月前

Anthropic的MCP标准助力GitHub与微软无缝对接AI模型与数据源

在微软 Build2025 大会上,GitHub 与微软宣布加入 MCP 指导委员会,支持Anthropic提出的模型连接协议,旨在增强 AI 模型与数据存储系统的整合。此举反映了 MCP 标准在 AI 行业日益增长的影响力。微软将提供全面 MCP 支持,包括 Azure 和 Windows 11,同时推出安全性增强的授权规范。GitHub 也推出了 MCP 服务器注册服务,简化服务器条目的存储库

3 个月前

微软新动作:VS Code升级为开源AI智能编辑器,强势对标Cursor与Windsurf

微软宣布Visual Studio Code(VS Code)转型为全球首款开源AI编辑器,并将GitHub Copilot Chat扩展开源,遵循MIT许可证。此举标志着微软深化对开源社区的承诺,并通过AI功能集成重塑开发者工具生态,对竞品形成挑战,为开发者提供更高效、灵活的开发环境

3 个月前

Anthropic亮相AI代理开发“宝典”:揭秘超越提示工程的七大核心策略

Anthropic发布AI代理开发指南,强调构建高效代理需结构化工作流、内存管理、明确规划、集成实用工具,并重视系统模式、自主性控制和编排能力,以实现复杂任务的自主完成

3 个月前

微软AI平台实现重大突破:200小时内发现新化合物,助力科学研究飞跃

微软在Build开发者大会上推出企业级AI平台“Microsoft Discovery”,该平台能显著加速科学研究与开发,特别是医药、材料科学和半导体行业。通过集成AI代理和高性能计算,无需编程即可协助科学家解决复杂研究问题。该技术已实现新型冷却剂的快速发现,并获多家公司关注以促进产品研发。平台通过自然语言用户界面简化用户体验,标志着科学计算的革命性进步

3 个月前

微软Build大会发布超50项AI新工具,加速构建智能'代理网络

微软在年度Build开发者大会上推出全面AI代理战略,发布超50项AI工具和平台,旨在推动开发者构建自主决策的智能系统。微软强调AI代理具备主动任务发起、独立决策和协作能力,并推出结构化RAG等技术提升AI记忆功能。同时,GitHub Copilot编码代理的发布标志着软件开发模式的转变。Azure AI Foundry更新支持多代理协同,助力企业自动化复杂业务流程。微软还强调云端与本地设备AI能

3 个月前

GitHub 发布革命性AI编程助手,自动识别并修复代码缺陷

在微软 Build 大会上,GitHub 发布了集成于 GitHub Copilot 的 AI 编程智能体,旨在提升开发者效率,自动执行代码修复与优化等任务。该工具支持实时变更记录与决策透明度,目前已向特定用户开放,标志着编程智能化的一大进步

3 个月前

英伟达领衔,巨头齐聚建设欧洲最大AI园区,2028年迎来开门运营

阿布扎比 AI 投资基金 MGX、法国国家投资银行、Mistral AI 与英伟达等机构联合宣布,将在巴黎建立欧洲最大的人工智能园区,预计装机容量1.4吉瓦,2024年下半年启动建设,2028年投入运营。此项目旨在推动欧洲 AI 产业发展,整合科技、工业与学术资源,促进区域经济及人才就业,提升法国在全球 AI 竞争中的地位

3 个月前

苹果自研AI聊天机器人媲美OpenAI ChatGPT,高管自信表态

苹果公司正自主开发AI聊天机器人,并在内部测试中取得显著进展,其性能被认为不逊于OpenAI的ChatGPT。在新任AI负责人领导下,公司对聊天机器人进行深入研发,并计划提升Siri的智能和实用性。尽管尚无公开产品上线,但市场对Siri的更新充满期待,预计新技术将在iOS 19的后期版本中亮相

3 个月前

苹果内部AI聊天机器人技术逼近ChatGPT,高管予以肯定

苹果公司正测试自主开发的AI聊天机器人,其技术水平已接近OpenAI的ChatGPT。在新任AI负责人领导下,苹果自研AI项目取得显著进展,计划提升Siri功能,以打造与ChatGPT竞争的产品。预计“Siri2.0”将在iOS19周期后期推出,苹果持续深化AI领域研发

3 个月前

字节跳动升级豆包AI耳机Ola Friend:新增英语学习智能体直接唤醒功能

字节跳动豆包旗下AI耳机Ola Friend完成重要升级,新增独立英文学习智能体Owen,支持用户通过语音实时进行英语对话练习,提升英语口语学习体验。此次升级强化了耳机的英语学习功能,并保持了其高度拟人化的交互特性

3 个月前
Sitemap.xml
© 2025 Juhe.ai
西安指尖漫步科技有限公司