AI最新资讯

不错过全球每一个AI革命的瞬间

最新资讯

英伟达创新力作:人形机器人引领工业革命新时代

英伟达推出人形机器人基础模型Isaac GR00T N1.5,显著提升训练效率,缩短数据采集时间至36小时,为工业革命奠定基础,多家行业领先企业已采用其技术

7 小时前

DeepMind 利用强化学习微调技术显著增强AI决策智能

本研究由谷歌 DeepMind 团队与约翰・开普勒林茨大学 LIT AI 实验室合作开展,旨在通过强化学习微调技术提升人工智能语言模型的决策能力。研究重点在于利用思维链强化训练,解决模型决策过程中的关键问题,显著提升了模型的逻辑推理与行动选择的准确性。实验结果表明,该方法有效缩小了模型推理与执行间的差距,并在多臂老虎机和井字棋任务中取得了显著性能提升

7 小时前

Google 推出 Imagen 4 及 Imagen 4 Fast:GCP Vertex 配额更新,AI 图像生成技术再突破

谷歌云平台Vertex AI新增Imagenn4与Imagenn4Fast模型,预示着下一代AI图像生成技术的广泛推广。这两款模型以强大的多模态生成能力和低延迟特性,为开发者与企业带来创新视觉体验。其动态共享配额系统优化了资源分配,而多模态功能及企业级整合预示着AI图像生成领域的新标杆。社区对此反响热烈,期待全面上线,推动视觉创作普及

8 小时前

Flowith NEO震撼上市!全球率先实现无限步骤、全语境支持的AI智能代理

Flowith推出全球首个无限步骤、上下文和工具支持的AI智能代理Agent NEO,具备强大的云端执行能力和多模态协作功能。该产品由10人团队在Hackathon中开发,已引发全球开发者关注。Agent NEO能够执行超长周期任务,支持大规模数据处理和多工具调用,其技术突破预示着AI生产力工具领域的重大进展

9 小时前

全新发布!一键AI打造您的个性化投资指数 —— ‘Generated Assets’震撼登场

Public推出AI驱动产品“Generated Assets”,通过AI分析市场数据生成定制化投资指数,允许用户实时跟踪表现,并提供历史回报对比。此创新产品简化投资流程,降低投资门槛,被视作零售投资领域的一大突破。尽管存在对透明度的疑问,但Generated Assets预示着AI在投资领域的深入应用和投资工具的智能化趋势

10 小时前

富士康联姻英伟达 共建百兆瓦级AI数据中心

富士康与英伟达合作推进人工智能数据中心建设,计划分阶段达成100兆瓦的功率规模,旨在支持台湾科技生态系统发展,并促进人工智能超级计算机的开发,强化台湾在全球科技竞争中的地位

11 小时前

Windows 11全新升级:原生集成MCP支持

微软宣布即将升级Windows系统,引入模型上下文协议(MCP)以增强AI应用与系统及服务的互动能力。此举旨在打造以AI为核心的操作系统,提升用户体验。同时,微软强调MCP的安全重要性,并推出Windows AI Foundry,简化AI模型集成流程,确保开发便捷性与安全性

11 小时前

美团AI发布对话式编程工具“NoCode”:挑战Lovable,开启零代码开发新篇章

美团加速AI战略布局,即将推出面向非技术用户的AI编程工具“NoCode”,目前正处于灰度测试阶段。该工具由美团研发质量与效率团队打造,旨在普及AI编程能力至更广泛用户,包括中小商家和运营人员,实现简单、对话式的应用构建。此产品是美团“AI in Products”战略的组成部分,预计将进一步提升开发效率和用户体验

11 小时前

Omni-R1:文本驱动强化学习与自动生成数据助力音频问答技术革新

研究团队开发了一种新型音频问答模型Omni-R1,基于Qwen2.5-Omni并通过GRPO强化学习优化。该模型在MMAU基准测试中实现最先进成绩,其性能提升主要归因于文本推理能力的增强。通过ChatGPT生成的数据集进一步提升了模型准确性,Omni-R1在音频问答领域树立了新标杆,并强调了文本推理在模型性能中的关键作用

13 小时前

马斯克强强联手微软,Grok AI模型强势登陆Azure云端平台

在微软 Build 开发者大会上,微软与 xAI 宣布将 Grok3 人工智能模型引入 Azure AI Foundry 平台,加强双方合作。Azure AI Foundry 平台支持多种 AI 模型,Grok 的加入提供新的功能。埃隆·马斯克和萨蒂亚·纳德拉强调 Grok 的真实性、准确性和安全性,以及在真实世界中的应用。马斯克期望 Grok 服务扩展至更多企业,展示 AI 技术对行业发展的推动

13 小时前

腾讯混元全新力作:一键生成游戏视觉盛宴

腾讯发布混元游戏视觉生成平台,基于混元大模型,为游戏行业提供高效的AI内容引擎,显著提升美术设计创作效率。平台整合设计流程,实现快速创作和实时反馈,并支持多种游戏风格,提高设计准确性和协作效率。未来数月内,腾讯混元计划推出更多增强功能,进一步推动游戏美术行业发展

13 小时前

火山引擎开源MCP Servers,加速大规模模型应用研发进程

火山引擎推出开源MCP Servers平台,助力企业共享自研工具,简化大模型应用开发流程,并通过集成丰富的MCP服务提升开发效率

14 小时前

突破性进展:融合卡尔曼滤波的全新人脸超分辨率模型,KEEP引领细节与时序一致性技术革新

Hugging Face社区推出了创新的视频人脸超分辨率模型KEEP,利用卡尔曼滤波原理和跨帧注意力机制,实现细节恢复与时序一致性的显著提升,成为该领域的最新SOTA。KEEP在性能上超越传统方法,适用于视频会议、影视修复等多场景,并在开源社区获得广泛关注,有望推动视频超分辨率技术的发展和应用

14 小时前

Nvidia 发布革命性 AI-DGX 个人超算系统,引领桌面级超级计算革新

Nvidia 推出 DGX Spark 和 DGX Station 个人 AI 超级计算系统,旨在提供高性能和效率,满足人工智能领域增长需求。DGX Spark 提供 1Petaflop 的计算能力,而 DGX Station 则提供高达 20Petaflops 的性能,适合复杂 AI 工作负载。两款系统预装 Nvidia AI 软件栈,将于夏季上市,合作伙伴包括 Acer、Dell、HP 等,以

14 小时前

一键速成利器:MoneyPrinterTurbo AI打造高清短视频

MoneyPrinterTurbo 是一款开源短视频自动生成工具,利用人工智能大模型实现自动生成视频文案、素材、字幕和背景音乐。该工具简化了视频制作流程,支持多种视频尺寸、批量生成、自定义字幕和语音合成,以及多模型接入。适用于内容创作者、教育工作者和企业营销人员,旨在提升视频制作效率与质量。开发者计划未来增加更多功能以优化用户体验

15 小时前

Claude 4 Sonnet & Opus全新亮相!Anthropic“Keynote”技术解析,AI编码革新背后的秘密揭晓

Anthropic即将发布的新一代AI模型Claude4Sonnet和Claude4Opus,具备在“思考模式”与“工具使用模式”间切换的能力,预计将提升复杂任务处理效率。Anthropic的“Keynote”流和Claude Code功能引起广泛关注,业界猜测与Claude4发布相关。新模型预计在编码、数学和视觉推理等基准测试中有显著提升,挑战现有市场主流AI模型。Anthropic的快速迭代策

15 小时前

谷歌全面上线Gemini网页版对话搜索,移动端跟进,引领AI搜索新变革

谷歌推出Gemini网页版对话搜索功能,基于Gemini2.5 Pro,允许用户以自然语言进行多轮搜索,提供智能、直观答案。此功能已向全球用户开放,并计划扩展至移动端。Gemini对话搜索通过高级推理和多模态能力,结合Google生态数据,提供个性化回答,对搜索市场产生重大影响,被视为AI搜索普惠化的里程碑

15 小时前

GitHub Models推出Grok3公开预览版:探索新一代AI模型

xAI发布Grok3人工智能模型公开预览版,提供强大的数据提取、代码编写和文本摘要功能,适用于多行业。Grok3具备实时更新能力,与GitHub Models集成,通过Azure AI Foundry支持企业应用,并通过API服务开放集成。xAI鼓励开发者体验并提供反馈,以促进模型优化

15 小时前

VS Code 正式开源 GitHub Copilot Chat 扩展:AI 编程加速器全新升级

微软宣布将 Visual Studio Code 的 GitHub Copilot Chat 扩展开源,并以 MIT 许可证发布,进一步推动 AI 驱动开发工具的开放性与创新。此举将允许社区协作优化 AI 代码编辑功能,提升开发效率与透明度,同时巩固 VS Code 在全球开发者中的领先地位

15 小时前

Salesforce全新BLIP3-o模型震撼加入Hugging Face!全开源多模态突破,图像处理与创作实力合一

Salesforce AI Research在Hugging Face平台发布BLIP3-o,一款全开源的统一多模态模型家族,以其高效的图像理解与生成能力获得广泛关注。BLIP3-o通过创新的扩散变换器架构和CLIP图像特征,实现训练效率与生成效果的显著提升。此模型的发布有望推动多模态AI领域的社区创新和应用扩展,尤其对教育和科研领域具有重要影响

15 小时前

无缝集成MLX-LM与Hugging Face,加速Apple Silicon设备上的大规模语言模型运行效率

Hugging Face平台已集成MLX-LM,为Apple Silicon设备用户提供了本地运行超4400种大型语言模型的便捷,无需依赖云服务。此更新优化了开发者的工作流程,推动了本地化AI开发的普及

16 小时前

全新上线!Bright Data MCP服务器搭载30+高效工具,一站式数据处理解决方案

Bright Data 推出开源 Model Context Protocol(MCP)服务器,集成30余工具以支持AI代理高效访问网络数据,解决IP封锁与访问限制问题。该服务器提供动态工具选择、支持多种平台,且完全开源,易于部署和使用。同时,其具备大规模数据处理能力,确保安全性,适用于复杂网络环境

16 小时前

Genspark 45天狂揽3600万美元ARR:20人小队缔造最快增长传奇

AI初创公司Genspark在45天内实现3600万美元的年度经常性收入增长,创历史纪录。该团队依靠零付费分销策略和创新的AI工具,如Genspark AI Sheet、Agentic Download Agent和AI Drive,取得显著市场渗透。Genspark的成功展示了对AI生态的深远影响,并被视为AI初创企业的标杆

16 小时前

Google NotebookLM iOS版正式发布,搭载Gemini 2.5 Flash强大赋能

Google 宣布推出 NotebookLM 人工智能助手移动应用,支持 iOS 和 Android 系统,实现跨平台研究体验。该应用保留核心功能,如智能总结、语义搜索和音频概述,并优化移动端使用场景,提供便捷的分享、上传和双栏布局。NotebookLM 移动应用的技术升级,整合 Gemini2.5Flash 模型,提升处理能力。同时,推出高级订阅服务 NotebookLM Plus,为用户带来更

16 小时前

全球首测!谷歌Jules测试版发布:AI写作新篇章,挑战Codex,尊享每日5次免费生成PR机会

谷歌推出基于Gemini2.5的AI编码代理Jules,旨在与OpenAI Codex竞争,具备自主分析代码库、生成GitHub PR等功能,每天提供5次免费任务。Jules的异步操作和GitHub深度整合,以及低门槛的体验,预计将对AI编码工具市场产生显著影响

16 小时前

妙多AI 2.0升级亮相:革新为人机协作,引领AI行业新趋势

妙多AI2.0升级聚焦人机协同,深度融合AI能力与专业编辑器,实现智能设计协作。新增“AI魔法框”等功能,提升设计效率与迭代速度,标志着界面设计AI助手向智能协作伙伴的转变

16 小时前

微软Edge升级新API,赋能开发者高效开发AI驱动的网页应用

微软在2025年Build大会上发布新Edge API,旨在简化开发者将AI功能集成至网页应用的过程,并计划与谷歌Chrome在AI网页应用领域竞争。新API支持接入Phi4mini模型,提供文本生成与编辑能力,同时Edge浏览器新增支持70种语言的PDF翻译工具

16 小时前

Anthropic的MCP标准助力GitHub与微软无缝对接AI模型与数据源

在微软 Build2025 大会上,GitHub 与微软宣布加入 MCP 指导委员会,支持Anthropic提出的模型连接协议,旨在增强 AI 模型与数据存储系统的整合。此举反映了 MCP 标准在 AI 行业日益增长的影响力。微软将提供全面 MCP 支持,包括 Azure 和 Windows 11,同时推出安全性增强的授权规范。GitHub 也推出了 MCP 服务器注册服务,简化服务器条目的存储库

16 小时前

微软新动作:VS Code升级为开源AI智能编辑器,强势对标Cursor与Windsurf

微软宣布Visual Studio Code(VS Code)转型为全球首款开源AI编辑器,并将GitHub Copilot Chat扩展开源,遵循MIT许可证。此举标志着微软深化对开源社区的承诺,并通过AI功能集成重塑开发者工具生态,对竞品形成挑战,为开发者提供更高效、灵活的开发环境

16 小时前

Anthropic亮相AI代理开发“宝典”:揭秘超越提示工程的七大核心策略

Anthropic发布AI代理开发指南,强调构建高效代理需结构化工作流、内存管理、明确规划、集成实用工具,并重视系统模式、自主性控制和编排能力,以实现复杂任务的自主完成

16 小时前

微软AI平台实现重大突破:200小时内发现新化合物,助力科学研究飞跃

微软在Build开发者大会上推出企业级AI平台“Microsoft Discovery”,该平台能显著加速科学研究与开发,特别是医药、材料科学和半导体行业。通过集成AI代理和高性能计算,无需编程即可协助科学家解决复杂研究问题。该技术已实现新型冷却剂的快速发现,并获多家公司关注以促进产品研发。平台通过自然语言用户界面简化用户体验,标志着科学计算的革命性进步

16 小时前

微软Build大会发布超50项AI新工具,加速构建智能'代理网络

微软在年度Build开发者大会上推出全面AI代理战略,发布超50项AI工具和平台,旨在推动开发者构建自主决策的智能系统。微软强调AI代理具备主动任务发起、独立决策和协作能力,并推出结构化RAG等技术提升AI记忆功能。同时,GitHub Copilot编码代理的发布标志着软件开发模式的转变。Azure AI Foundry更新支持多代理协同,助力企业自动化复杂业务流程。微软还强调云端与本地设备AI能

16 小时前

GitHub 发布革命性AI编程助手,自动识别并修复代码缺陷

在微软 Build 大会上,GitHub 发布了集成于 GitHub Copilot 的 AI 编程智能体,旨在提升开发者效率,自动执行代码修复与优化等任务。该工具支持实时变更记录与决策透明度,目前已向特定用户开放,标志着编程智能化的一大进步

16 小时前

英伟达领衔,巨头齐聚建设欧洲最大AI园区,2028年迎来开门运营

阿布扎比 AI 投资基金 MGX、法国国家投资银行、Mistral AI 与英伟达等机构联合宣布,将在巴黎建立欧洲最大的人工智能园区,预计装机容量1.4吉瓦,2024年下半年启动建设,2028年投入运营。此项目旨在推动欧洲 AI 产业发展,整合科技、工业与学术资源,促进区域经济及人才就业,提升法国在全球 AI 竞争中的地位

16 小时前

苹果自研AI聊天机器人媲美OpenAI ChatGPT,高管自信表态

苹果公司正自主开发AI聊天机器人,并在内部测试中取得显著进展,其性能被认为不逊于OpenAI的ChatGPT。在新任AI负责人领导下,公司对聊天机器人进行深入研发,并计划提升Siri的智能和实用性。尽管尚无公开产品上线,但市场对Siri的更新充满期待,预计新技术将在iOS 19的后期版本中亮相

16 小时前

苹果内部AI聊天机器人技术逼近ChatGPT,高管予以肯定

苹果公司正测试自主开发的AI聊天机器人,其技术水平已接近OpenAI的ChatGPT。在新任AI负责人领导下,苹果自研AI项目取得显著进展,计划提升Siri功能,以打造与ChatGPT竞争的产品。预计“Siri2.0”将在iOS19周期后期推出,苹果持续深化AI领域研发

16 小时前

字节跳动升级豆包AI耳机Ola Friend:新增英语学习智能体直接唤醒功能

字节跳动豆包旗下AI耳机Ola Friend完成重要升级,新增独立英文学习智能体Owen,支持用户通过语音实时进行英语对话练习,提升英语口语学习体验。此次升级强化了耳机的英语学习功能,并保持了其高度拟人化的交互特性

17 小时前

火山引擎全新推出:大模型生态广场MCP Servers平台

火山引擎推出MCP Servers平台,标志着AI开发进入模块化组装时代,实现全链路开发闭环,简化开发流程。该平台集成众多工具,支持火山引擎及第三方服务,提供开源特性和火山方舟、Trae的深度支持,促进生态共建,提高开发效率,助力AI应用广泛部署

17 小时前

B站独家开源:Index-AniSora,打造次元世界顶级动画视频生成技术

哔哩哔哩(B站)于2025年5月19日开源Index-AniSora模型,实现二次元风格视频一键生成,提升动画内容生产效率与质量。该模型基于AniSora,采用强化学习技术框架,通过人类反馈进行优化,构建高质量奖励数据集并推出AnimeReward奖励系统。实验显示,Index-AniSora性能优于基线模型,为二次元内容创作带来新可能性

17 小时前

高通强势回归数据中心领域,专注AI时代低功耗高效能产品研发

高通公司CEO克里斯蒂亚诺·阿蒙在Computex大会上宣布,高通计划重返数据中心市场,并即将推出基于AI的颠覆性产品。此外,骁龙X处理器获得广泛应用支持,新一代PC处理器将于9月发布,预期将带来显著性能提升

1 天前

抖音开展“智能清朗行动”:全面整治AI生成低俗账号内容

抖音官方宣布开展“AI 起号”专项治理行动,旨在清除平台内利用人工智能生成低俗内容等违规行为。行动包括清理311条违规内容,封禁15个账号,强调用户合法使用AI并标注声明,以维护平台生态平衡

1 天前

NVIDIA新一代GeForce GPU惊艳发布!黄仁勋揭示AI与模拟融合新篇章,打造游戏与创作美学新高度

NVIDIA在台北COMPUTEX2025大会上发布全新GeForce GPU系列,集成AI加速单元和光线追踪技术,显著提升游戏与内容创作性能。首席执行官黄仁勋强调AI与模拟的融合,推出DLSS4技术,实现高帧率与画质。新GPU与Grace Blackwell GB300 AI系统协同,巩固NVIDIA在AI与图形硬件领域的领导地位,预示着AI硬件与生态系统的未来发展

1 天前

微软创新AI协作新模式:推出跨公司合作标准协议

微软首席技术官凯文・斯科特提出,微软正推动行业标准建立,旨在实现不同公司AI代理的无缝协作。微软支持模型上下文协议(MCP),以增强AI应用的数据交互能力。此外,微软探索结构化检索增强技术,提升AI代理记忆用户互动的能力,预示着未来AI将形成协作智能网络

1 天前

2025春:AI领域新动向,OpenAI与Anthropic双龙戏珠,可灵异异军突起

2025春季AI模型使用趋势报告》显示,OpenAI GPT-4.1、Google Gemini2.5Pro等新型AI模型快速崛起,文本、图像、视频、音频及推理模型需求持续增长。报告指出,AI使用模式发生深刻转变,多模态应用扩展迅速,中国模型Kling2.0在视频生成领域异军突起,对AI生态产生深远影响

1 天前

Google搜索AI Mode实验上新:开启智能问答新篇章

Google 推出实验性功能“AI Mode”,通过文本、语音或图像提供智能问答服务,支持深入探索和信息链接提供。此功能在搜索实验室范围内测试,旨在优化服务质量,同时重视用户隐私与反馈

1 天前

Sparks视频概览:NotebookLM新功能亮相,Gemini与Deep Research助力1-3分钟AI视频生成

谷歌旗下研究工具NotebookLM即将推出“Sparks”视频概览功能,利用AI生成10%的内容,结合Gemini2.5 chatbot和Deep Research报告功能,实现从文档到短视频的智能化内容创作。此功能预计将简化视频制作流程,适用于教育、研究和商业领域,并对AI内容生成领域产生深远影响

1 天前

GenSpark发布全球首款智能代理Agentic AI,引领文件管理革新潮

GenSpark推出全球首个人工智能代理下载工具Agentic Download Agent及AI Drive功能,通过自然语言指令实现文件的搜索、下载和智能管理,显著提升工作效率。该工具支持多种文件类型,具备批量处理、智能整理和透明操作等优势,预计将为研究人员、内容创作者和中小企业主带来革命性改变

1 天前

马斯克旗下AI聊天机器人Grok为“编程失误”致歉

人工智能聊天机器人 Grok 在回答大屠杀相关问题时的不当言论引发争议,被指为编程错误。开发公司 xAI 承认错误并承诺加强审核,同时 Grok 也涉及传播不实阴谋论,受到南非总统的强烈反驳

1 天前

MathModelAgent:智能数学建模助手,一键解题到论文撰写全流程服务

MathModelAgent,一款革命性的数学建模AI助手,通过多智能体协作实现了从问题分析到论文撰写的全流程自动化,显著提升学术研究效率。该工具支持多种数学问题类型,具备代码生成与调试、论文自动撰写等核心功能,已在开源社区引发广泛关注,并有望成为数学研究和教育领域的重要助力

1 天前

2025年谷歌I/O大会惊艳亮相:Gemini AI搜索引擎颠覆传统,开启灰度测试,行业竞争加剧

谷歌计划在即将到来的I/O开发者大会上推出基于Gemini2.5的下一代AI搜索引擎,取代传统搜索框界面,目前已进入灰度测试阶段。此举将对OpenAI、Perplexity等竞争对手构成重大挑战,并可能重塑全球搜索市场。新搜索引擎将以AI Mode为核心,提供沉浸式交互体验,预计将在I/O2025大会上全面展示Gemini生态的升级

1 天前

Google I/O大会将揭幕:Gemini驱动全新AI搜索引擎惊艳亮相

Google计划在年度I/O开发者大会发布基于最新生成式AI模型Gemini的全新搜索引擎,预计将引发搜索引擎领域重大变革,提升搜索效率和用户体验,并对竞争对手构成挑战

1 天前

广东移动革新推出AI通话系列新品,通信品质飞跃升级

广东移动发布AI通话系列产品,包括AI速记、AI秘书、AI家秀、AI礼遇和AI伴聊,旨在通过AI技术提升通信体验,实现便捷的通话记录、智能来电处理、情感化沟通以及24小时陪伴服务。这些创新产品将覆盖个人和商务场景,为用户带来智能化、个性化的通话新体验

1 天前

ChatGPT升级整合MCP协议,赋能企业轻松接入多元化人工智能服务

OpenAI 正在测试支持 MCP(模型上下文协议)的新功能,预计将使 ChatGPT 能与第三方 AI 服务无缝对接,提升个性化用户体验。该协议由 Anthropic 开发,旨在统一 LLM 与外部系统的互动,提高企业工作效率和决策智能化。当前功能处于测试阶段,预计即将正式推出

1 天前

中信证券:探秘管理软件——AI Agent应用的最佳领域之一

中信证券研究报告预测,2025年将是AI应用落地关键年,AI Agent场景将迅速增长。报告强调,传统行业领先企业凭借行业经验和技术积累,在AI转型中具有竞争优势。建议投资者关注AI在管理软件核心模块的应用,尤其是企业服务领域内的龙头企业,以把握投资机会

1 天前

QQ浏览器全新升级:AI驱动,QBot智能助手带来五大核心AI功能革新

QQ浏览器升级为AI浏览器,推出AI助手QBot,实现智能搜索、阅读、写作、翻译及办公辅助等功能,提供24小时不间断的智能陪伴,显著提升用户浏览体验和工作效率

1 天前

阿里通义实验室发布ZeroSearch:实现大模型自主“搜索”无需依赖API

阿里通义实验室推出ZeroSearch框架,通过模拟搜索环境和渐进式抗噪训练,提升大型语言模型(LLM)的检索与推理能力,无需依赖真实搜索引擎,有效降低训练成本,并在问答任务中表现出显著优势

1 天前

ListenHub全新升级:AI智能播客生成工具震撼登场,重塑聆听体验

ListenHub,一款基于AI的播客生成器,以其快速生成、个性化定制和用户友好的界面获得广泛关注。该工具支持中英双语,利用AI技术高效生成专属播客内容,满足用户和创作者的多样化需求,为播客行业注入新活力

1 天前

Qwen推出WorldPM系列:重塑偏好建模新篇章

阿里巴巴Qwen团队推出WorldPM偏好建模模型系列,包括WorldPM-72B及其衍生版本,旨在通过大规模数据训练实现偏好建模的规模化定律,显著提升模型在监督学习和偏好评估中的表现。该系列模型已开源,并在Hugging Face平台供全球开发者使用,标志着偏好建模领域的重要进展

1 天前

蚂蚁集团CTO深度解析:大数据短缺导致大模型“幻觉”问题

在OceanBase开发者大会上,蚂蚁集团CTO何征宇强调数据是AI发展的基石,其量和质量决定AI模型能力。他指出数据获取成本上升及数据流通障碍为AI领域主要挑战,并透露蚂蚁集团将利用OceanBase平台在关键领域实现突破,推动开源战略,向通用人工智能迈进。何征宇的见解为AI技术发展提供了方向,强调重视数据获取与应用的重要性

1 天前

Ollama全新升级:推出高效多模态AI引擎,推理性能大幅飞跃

Ollama 推出独立研发的多模态 AI 引擎,采用 Golang 开发,专注于提升本地推理精度及图像处理能力。该引擎引入创新技术,优化内存管理,提高效率,支持先进数据处理技术,为开发者提供强大的 AI 应用潜力

1 天前

Minion-Agent智能任务框架:集成浏览器操作与MCP实现自动化研究及工具调用

Minion-Agent,一款集成了先进AI技术的智能体框架,以其自动化任务处理能力和多场景应用灵活性,成为AI领域的关注焦点。该框架能够高效执行复杂任务,如自动收集数据、生成分析报告,并支持用户自定义功能,适用于科学研究、市场调研、媒体制作及个人生产力提升等多个领域

1 天前

Meta 诉请法官在反垄断诉讼中做出预先判决

Meta公司针对美国联邦贸易委员会(FTC)提起的反垄断案件,向法庭提出提前裁决的动议,主张FTC未能提供充足证据证明其垄断行为。Meta强调面临激烈市场竞争,而FTC通过高管证词试图支撑其指控。法庭审理持续进行,Meta将进行辩护。关键信息包括:Meta请求提前裁决,FTC证据不足,法庭审理继续,Meta强调市场竞争

1 天前

研究发现:AI聊天机器人数据总结能力下滑,关键信息频繁遗漏

最新研究表明,新一代AI聊天机器人在信息总结时存在严重问题,高达73%的概率遗漏关键信息。分析显示,这些机器人在提供科学研究总结时,错误率远高于人类,且随着版本更新,错误率呈现上升趋势。研究强调了在医疗等关键领域,AI的细节遗漏可能导致严重后果,并指出AI开发者需解决这些问题,以确保AI生成的信息准确可靠。同时,研究提出对LLM的提示影响其回答,但对其在科学论文总结上的影响尚需进一步研究

1 天前

苹果AI计划受阻:新一代Siri亮相WWDC延期,团队内部分歧致进展缓慢

苹果公司面临AI战略失误与内部冲突,导致Siri升级版发布延迟,且在AI领域发展落后。公司虽计划在WWDC展示部分进展,但预计不会重点提及。苹果曾尝试收购AI企业以增强技术,内部对AI投资存在分歧,同时准备区分Apple Intelligence与Siri,调整产品营销策略

1 天前

Nest 音响推出蓝紫渐变灯光效果,Google Gemini 助手全新测试阶段曝光

谷歌正在逐步推出其新一代 AI 助手 Gemini,已在 Nest 智能扬声器上展开测试,用户观察到蓝紫渐变灯光,预示着新功能的引入。参与测试的用户需注册 Google Home 公共预览,体验实验性 AI 功能。此举旨在提供更智能化、个性化的服务,以优化用户体验

1 天前

Anthropic携手25亿美元信贷大增,年收入飙升至20亿美元新高度

Anthropic公司获得25亿美元信贷额度,以增强财务流动性并支持业务扩展。该公司估值达615亿美元,年化收入翻倍,其技术将应用于亚马逊Alexa新功能,彰显市场地位和影响力。此轮融资将为Anthropic提供资金支持,加速研发并提升产品竞争力,预计将推动AI领域创新解决方案的发展

1 天前

Stability AI联合Arm打造手机级快速音频生成AI:11秒立体声只需7秒

Stability AI与Arm合作推出了紧凑型文本转音频模型“Stable Audio Open Small”,基于ARC技术,能在移动设备上高效运行,实现快速音频生成。该模型较原版大幅减少参数,优化了模型架构,适合消费级硬件,但音乐生成能力有限,主要支持英语输入,并采用大量合规音频片段训练

1 天前

杭州机场率先实现AI大模型智能呼叫中心,全面提升服务品质

杭州萧山国际机场5月16日启用全国民航首个基于AI大模型的智能呼叫中心,采用DeepSeek技术,显著提升客户服务效率与质量。该中心构建了行业首个AI服务体系,实现动态情绪感知与智能交互,缩短旅客等待时间,增强服务人性化

1 天前

AI自主构建社会结构:研究揭示智能体形成独特规范与习俗

最新研究显示,伦敦大学城市学院与哥本哈根信息技术大学的研究人员发现,人工智能模型能够在无外部干预下自发形成社会规范与习俗。该成果发表在《Science Advances》杂志,揭示了AI群体行为研究的新进展,对于理解和引导AI技术发展方向具有重要意义

1 天前

Firecrawl初创公司追加投资,百万美元招募AI智能代理员工

Firecrawl,一家由Y Combinator支持的初创公司,再次启动AI代理招聘计划,并为此拨款100万美元。该公司在YC招聘平台上发布三个AI职位,但首次尝试未能成功。Firecrawl提供网站数据抓取工具,并强调其防护措施。新招聘的AI代理需具备自主创作、客服和开发能力。公司同时考虑聘请真人开发AI机器人,并展望AI操作员的未来角色。Firecrawl的模式并非唯一,AI代理取代开发者的

1 天前

张朝阳:晚生30载,我将深度参与AI领域风云

在2025搜狐科技年度论坛上,张朝阳、张亚勤和傅盛等科技领域专家深入讨论了人工智能、人形机器人和脑科学等前沿科技。张朝阳指出,若晚生30年,他将投身AI领域;傅盛认为中国在AI应用和工程化方面有超越美国的潜力;张亚勤强调年轻人在AI领域创新速度快,成果显著。专家们对未来中国在AI领域的竞争力表示信心

1 天前

OpenAI 宣布阿布扎比打造顶级数据中心,规模震撼超越摩纳哥

OpenAI 与阿联酋G42合作,将在阿布扎比建设全球最大之一的数据中心园区,耗电达5000兆瓦,面积10平方英里,支持高端AI模型训练。该项目为“星际之门”计划关键部分,旨在满足增长算力需求,并推动AI在中东的应用与发展。微软投资15亿美元支持该计划,与G42共同推动全球云计算布局

1 天前

探索B站新力作:AniSora开源动漫视频生成模型,一键切换多样动画风格

B站团队于5月12日开源动漫视频生成模型AniSora,旨在通过一键生成多种风格动漫视频,提升创作灵活性。AniSora针对动漫视频生成领域的挑战进行优化,实现人物和运动一致性达到最高标准,并提供了丰富的示例视频。该模型的开源发布,为开发者和动画爱好者提供了新的创作工具

1 天前

OpenAI 发布革命性编程助手 Codex,重塑编程未来

OpenAI recently launched Codex, an AI-powered programming assistant optimized for software engineering, capable of completing complex development tasks within 30 minutes. Codex seamlessly integrates w

1 天前

OpenAI发布GPT-5:全能助手新升级,集成多元化功能震撼亮相

OpenAI 研究副总裁 Jerry Tworek 近期透露,即将发布的 GPT-5 模型将整合 Codex、Operator 等产品,提高编程效率并优化用户体验。GPT-5 旨在提升模型性能,特别是在计算机任务执行能力上。OpenAI 计划通过检索增强生成技术提升模型信息更新能力,并致力于将软件需求更高效地转化为可运行版本,为开发人员提供便捷。此外,OpenAI 将为 Plus 和 Pro 用户

1 天前

OpenAI 发布 GPT-5:全新一代模型实现多产品融合突破

OpenAI 研究副总裁 Jerry Tworek 透露,下一代基础模型 GPT-5 将整合 Codex、Operator、Deep Research 和 Memory 等工具,旨在简化用户体验。Codex 经优化,编程效率提升三倍,主要服务于解决琐碎问题的开发者。OpenAI 推出灵活定价策略,并计划通过 Codex 加速新手开发者的学习进程,增强人类开发者的能力

1 天前

OpenAI发布革命性云端编程助手Codex,极大提升开发者工作效率

OpenAI 官方推出云端代码助手 Codex,旨在提升开发者编码效率,自动化执行编码任务,支持代码编写、错误修复等功能。基于 Codex-1 模型,该工具能生成符合开发者风格和指令的代码,预计将助力开发者专注于创造性工作,成为开发流程的重要辅助工具

1 天前

OpenAI 再创新举: Codex AI 编程助手助力工作效率飞跃

OpenAI正式推出云端AI编程智能体Codex,开启AI编程新时代。Codex基于定制模型codex-1,能在半小时内完成复杂的软件工程任务,显著提升开发效率。该系统安全高效,与GitHub集成,已向全球用户开放,预示着软件开发领域的革命性变革

3 天前

苹果全新CarPlay Ultra震撼上市:全面升级仪表盘交互,ChatGPT赋能,引领智能驾驶革命

苹果公司推出新一代车载系统CarPlay Ultra,实现iPhone与汽车显示屏的深度整合,引入ChatGPT提升驾驶交互智能化。系统全面覆盖中控屏和数字仪表盘,提供统一苹果设计语言和高效交互体验,同时允许车辆功能的无缝管理。CarPlay Ultra支持品牌定制和个性化设置,计划扩展至更多车型,标志着苹果在智能驾驶领域的战略突破,预计将推动行业变革

4 天前

AI“健忘”难题终结!Supermemory发布“无限记忆增强器”,赋予AI持久记忆能力

Supermemory公司近日推出Infinite Chat API,旨在无限扩展大语言模型的上下文长度,赋予AI“长期记忆”能力。该技术通过透明代理机制、智能分段与检索系统及自动Token管理,实现了高效、低成本的性能提升,易于集成且兼容性广泛。专家认为,该技术有望降低开发者集成AI代理的门槛,推动交互式AI应用普及

4 天前

Comet浏览器beta版震撼发布:Perplexity引领网络浏览新革命

Perplexity公司推出其代理智能浏览器Comet的beta版,限定部分Apple Silicon Mac用户测试。该浏览器通过上下文感知智能优化浏览体验,支持Chrome数据导入,集成了Perplexity搜索功能。Comet强调工作效率提升,提供助手功能,目前处于开发阶段,期待用户反馈

4 天前

MiniMax Speech-02超越OpenAI和ElevenLabs,夺得全球TTS技术冠军

MiniMax Audio的Speech-02系列语音模型在全球范围内取得显著成就,登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大榜单,领先于国际竞争对手。该模型以其超高语音逼真度和多语言支持,成为AI语音技术的新标杆,展现了零样本克隆、多语言覆盖等核心技术创新,对AI语音应用生态产生深远影响,并标志着国产AI在全球市场的突破

4 天前

复旦大学与腾讯联合研发:DICE-Talk说话人视频生成工具,情感表现更逼真

复旦大学与腾讯联合研发的DICE-Talk技术,通过身份-情感分离机制,实现高度逼真的视频生成,具备自然情感过渡和个性化定制能力,适用于多领域应用。该技术仅需图像和音频输入,即可生成具有真实性和表现力的情感视频

4 天前

Sam Altman 前瞻未来:ChatGPT如何记录你的生活每一刻

OpenAI首席执行官Sam Altman提出ChatGPT未来发展的新愿景,强调个性化服务与用户生活经历的整合。他设想开发能够理解用户生活脉络的推理模型,并指出该技术同样适用于企业数据洞察。同时,Altman提醒需警惕大型科技公司的潜在风险,并关注技术进步与道德风险的平衡

4 天前

xAI透明化处理Grok系统更新,积极回应近期争议性修改

xAI 因其聊天机器人 Grok 在处理种族灭绝话题时产生争议性回应而受到关注。公司调查发现,机器人系统提示符遭未授权修改,违反内部政策。xAI 正采取措施加强审查流程,并公开系统提示以增强透明度,确保产品可靠性

4 天前

腾讯升级混元图像2.0:毫秒级实时生图速度+超写实画质革新亮相

腾讯推出混元图像2.0模型,实现毫秒级图像生成响应速度,显著提升图像质量,并在GenEval基准测试中准确率超过95%。新模型具备实时绘画板功能,优化设计师创作流程,并预示多模态图像生成大模型的研发进展

4 天前

SmolVLM震撼亮相!WebGPU加速,摄像头实时AI体验,无需服务器,本地网页即点即用

Hugging Face推出的SmolVLM多模态模型,通过WebGPU技术实现浏览器内实时图像识别,无需服务器支持,提升了隐私保护并降低了AI应用部署门槛。SmolVLM优化了边缘设备上的性能,支持多种AI任务,展示了多模态AI的普惠潜力,并在开发者社区获得高度认可,预示着本地AI的隐私与效率革命即将到来

4 天前

开发者必看:OpenAI官方宣布明日举行新品发布直播

OpenAI定于美国西部时间明天早上8点举办新品发布直播,特别邀请开发者及有意向成为开发者的群体观看

4 天前

Windsurf革新力作:SWE-1系列AI模型震撼登场,超越Claude 3.5,效率飙升99

Windsurf(原Codeium)推出自主研发的AI模型家族SWE-1系列,针对软件工程全流程进行优化,包含SWE-1、SWE-1-lite和SWE-1-mini三种模型,旨在提升开发效率。该系列通过流感知设计,解决了复杂任务处理的局限性,并支持跨工具协作。SWE-1系列的发布标志着Windsurf向自主研发转型,对AI开发生态产生深远影响

4 天前

CodeRabbit AI代码审查工具升级:全面适配Cursor、VS Code及Windsurf编辑器

CodeRabbit推出AI代码审查工具免费集成至主流开发环境,提供实时、上下文感知的审查体验,显著提升代码质量与开发效率。该工具支持多场景应用,从个人开发到团队协作,通过智能审查缩短审查时间并检测出更多错误,同时强调辅助而非取代人工审查,确保代码安全

4 天前

Psyche去中心化网络:Nous Research引领全民AI开发新时代

Psyche平台,由Nous Research推出,是基于Solana区块链的去中心化AI训练网络,旨在通过DisTrO技术降低带宽需求,实现全球分布式GPU资源的整合,共同训练大型AI模型。该平台开源所有数据和检查点,推动AI民主化,允许用户贡献计算资源参与AI开发,对AI领域的去中心化和普惠化产生重要影响

4 天前

一键转换!Firecrawl模板助您快速打造LLM训练数据,AI研发效率提升10倍

Firecrawl发布开源工具包“模板”,集成了游乐场设置、代码片段和存储库,简化了将网站转化为大语言模型(LLM)就绪数据的过程。该工具包降低了AI数据抓取的技术门槛,提高了构建AI驱动应用程序的效率。其核心功能包括一键式数据抓取,支持多种LLM友好格式,并具有AI驱动的智能导航和动态内容处理能力。Firecrawl模板的开源特性和灵活性使其适用于多种应用场景,包括AI训练数据收集、商业智能和内

4 天前

Manus革新视觉AI:文字即图像,AI任务执行迎来新篇章

Manus推出了一款具备智能规划与多工具协同能力的图像生成Agent,标志着其在人工智能通用代理领域的重大进展。该Agent能够理解和执行用户高层次任务指令,自动制定执行计划并生成高质量图像。此技术突破为创意设计、游戏开发和商业营销等行业带来了新的应用可能性,并引发了关于AI代理技术自主性及伦理问题的讨论

4 天前

Hugging Face推出MCP免费教程:一日掌握AI上下文协议精髓

Hugging Face推出Model Context Protocol(MCP)免费在线课程,旨在教授开发者如何使用MCP协议构建高效的AI上下文交互系统。课程内容涵盖MCP协议基础、SDK使用、服务自建等,强调理论与实践结合,适合不同水平的AI开发者。该课程采用互动式和开源模式,提供社区支持和实践导向学习,对推动AI Agent开发具有重要意义

4 天前

中国联通华为强强联手,推出自主可控“智家通通”家庭机器人,十项全能助力智慧家居

中国联通与华为合作推出国产自主家庭机器人“智家通通”,具备全自研设计、研发、标准和运营优势,集十大应用功能于一身,旨在打造智能家居中心,预计将推动国内智能家居市场新一轮竞争

4 天前

ElevenLabs发布SB-1 Infinite Soundboard:可定制音效控制面板新利器

ElevenLabs推出AI音效控制面板工具SB-1Infinite Soundboard,通过Text-to-SFX模型实现文本驱动的无限音效生成,简化创作流程,适用于直播、影视和表演等多场景。该工具受到创作者社区的热烈追捧,被视为音效创作的革命性变革。ElevenLabs的此项创新巩固了其在AI音频领域的领先地位,并预示着未来在VR和游戏开发等领域的应用潜力

4 天前

通付盾全新力作:Legion多智能体协同平台震撼来袭

摘要:在AI应用时代,多智能体协同技术成为核心,智能体经济成为商业市场的新机遇。Legion作为大规模智能体协同平台,以智能体数字身份、通用协议和数据容器为技术基础,构建去中心化的智能体网络。Legion通过神经网络协同管理和决策引擎效能管理,实现人机共生的新管理范式。智能体市场的发展将促进跨领域能力流动,形成开放的价值交换网络,为商业市场带来变革

4 天前

Llamafile 0.9.3全新升级:独家兼容Qwen3,实现单文件运行大模型,跨平台体验再突破,AI推理轻松上手

Mozilla开源项目Llamafile发布0.9.3版本,新增支持Qwen3系列大语言模型,实现单文件集成,提升跨平台便携性和部署效率。此版本优化了推理性能,兼容多种CPU架构,并提供Web GUI聊天界面和OpenAI兼容API。Llamafile的更新为AI开发者提供了低成本、高效的本地AI解决方案,推动AI技术在多领域的广泛应用

4 天前

Cognichip 创新型AI芯片设计获3300万美元投资,引领行业变革

Cognichip,一家专注于人工芯片智能的旧金山公司,宣布推出其首款产品并完成3300万美元种子轮融资,由Lux Capital和Mayfield领投。该产品采用物理信息基础模型(PIFM),旨在加速半导体开发周期并降低成本。Cognichip的ACI技术能缩短设计周期50%,降低开发成本75%,并提高供应链灵活性

4 天前

Meta 推出巨型化学数据集 OMol25 与创新通用模型 UMA,引领AI化学研究新篇章

Meta 发布了史上最大规模的化学开放数据集 OMol25 和通用人工智能模型 UMA,旨在加速药物研发和材料科学研究。OMol25 数据集涵盖广泛分子类型,提供详细化学性质数据,而 UMA 模型能在原子层面预测化学性质,实现快速计算与高精度预测。同时,Meta 推出“伴随采样”技术,能在数据缺乏情况下生成新分子结构。尽管存在挑战,这些创新为化学研究带来革命性进展

4 天前
Sitemap.xml
© 2025 Juhe.ai
西安指尖漫步科技有限公司