AI最新资讯

不错过全球每一个AI革命的瞬间

最新资讯

英国议会新规:AI企业须公开版权材料使用详情

英国议会提出新修正案,要求AI公司披露版权使用情况,以保护创意产业权益。修正案由跨党派议员提出,旨在反对AI公司在未经许可下使用版权作品的做法,同时为政府执行条款提供灵活性。该修正案将于5月19日辩论,旨在实现透明度,确保版权持有者权益,而政府的版权提案因允许未经许可使用版权作品而引发争议

4 天前

美国国会酝酿新法案:全面禁止各州对人工智能实施监管

美国国会众议院能源与商务委员会提出了一项十年期联邦禁令,禁止各州对人工智能及其相关技术实施法律或监管措施。该禁令旨在剥夺地方立法权,阻碍透明度和问责制的实施,并可能降低公众对AI系统的信任度。反对者认为,此举忽视了地方立法的重要性,限制了政策创新,并缺乏相应的联邦法规替代

4 天前

国产MiniMax语音模型惊艳国际,开启个性化语音交互新纪元

国产大模型在人工智能领域取得显著进展,MiniMax公司推出的文本转语音模型“Speech-02”在国际评测榜单Artificial Analysis上位居榜首,超越OpenAI等竞争对手。该模型在字错率和说话人相似度等关键指标上实现最佳结果,且成本仅为竞争对手的四分之一。其成功得益于零样本语音克隆技术和Flow-VAE架构的创新应用,以及T2V框架的引入,彰显了我国在语音合成技术领域的崛起

4 天前

OpenAI领先AI工具流量竞技场,谷歌紧随其后位列第二

OpenAI的AI工具在过去两月访问量显著增长,达到日均1.9亿次,占据近80%市场份额,主要得益于GPT-4o更新和微软合作。谷歌Gemini访问量稳定在2500万次,未能成为用户首选。DeepSeek和Grok增长迅猛,挑战谷歌市场地位

4 天前

特朗普携手阿布扎比签署协议,共同打造顶级 AI 数据中心

美国与阿联酋签署重要协议,合作在阿布扎比建设总容量达5吉瓦的大型数据中心,以推动人工智能技术发展。此协议象征美国在海外最大数据中心部署计划的启动,旨在加强美阿科技合作,促进区域经济多元化和科技进步

4 天前

OpenAI 与 CoreWeave 签署 40 亿美元云计算大单,深化战略合作关系

CoreWeave 与 OpenAI 签订了一项40亿美元的云计算合作协议,期限五年,同时签署了一份近120亿美元的长期合同,OpenAI 获得股份。该合作旨在增强CoreWeave的市场份额和技术能力,同时降低对微软的依赖,并巩固OpenAI在AI领域的领导地位

4 天前

YouTube 创新AI广告策略“Peak Points”:Gemini 引领用户注意力捕捉新纪元

YouTube 推出基于谷歌 Gemini AI 的“Peak Points”广告工具,旨在通过在视频高光时刻后投放广告,提高广告曝光度和点击率。该工具通过分析视频内容确定吸引力峰值,目前已进入试点阶段,计划今年全面推广。此举措旨在提升广告相关性和观看体验,但其市场效果尚待验证

4 天前

Soundcloud 更新政策:用户现可拒绝AI训练,数据利用问题未解

Soundcloud 更新使用条款,明确需用户明确同意才可将内容用于生成式 AI 训练,并承诺提供退出选项和增强透明度。此举回应了用户对数据隐私和版权的担忧,但关于数据使用具体细节和集体风格与个人特征界定的问题仍待进一步明确

4 天前

DeepSeek-V3 重磅论文发布:低成本实现大型模型训练的秘诀解析

DeepSeek团队发布技术论文,探讨大规模AI模型训练的“扩展挑战”及硬件架构考量,提出DeepSeek-V3模型采用DeepSeekMoE和MLA架构,显著提升内存效率并降低训练成本。论文由CEO梁文锋参与撰写,强调硬件与模型架构的联合优化对解决LLM扩展问题至关重要

4 天前

Meta宣布延迟Behemoth游戏发布,引发内部焦虑,股价跌幅超3

Meta Platforms 宣布推迟旗舰 AI 模型 Behemoth 的发布,从原定的2023年4月延至2025年秋季或更晚。此举引发了对公司 AI 投资方向的担忧,并导致股价下跌超3%。公司内部对 AI 产品团队的表现不满,考虑进行管理调整,以应对在全球 AI 领域的竞争压力

4 天前

CoreWeave携手OpenAI签署40亿美元云计算大单,合作延期至2029年

CoreWeave与OpenAI签订了一份价值40亿美元的云计算服务协议,将持续提供计算能力至2029年,彰显了CoreWeave在云计算市场的重要性及OpenAI对高性能计算资源的迫切需求。此合作预计将加速OpenAI在人工智能研发的进展,并对云计算与AI行业产生长远影响

4 天前

DeepL翻译革新:全新自研AI模型助阵,写作助手强势上线

DeepL近日更新其API,引入自研语言模型及写作助手DeepL Write,旨在提升文本质量和翻译准确性。该API支持33种语言,强调用户数据安全,不用于模型训练,标志着DeepL在翻译与写作领域的进一步拓展

4 天前

淘宝天猫新功能:AI图生视频助力商家视频制作效率翻倍

淘宝天猫推出“图生视频”AI工具,助力商家高效应对618大促,通过上传商品图片即可自动生成短视频,提升内容制作效率,显著降低成本。此外,“脚本成片”与“搭配视频”功能进一步丰富商家营销手段。2025年天猫618购物节将简化促销策略,淘宝天猫AI工具全面覆盖商家经营全链路,提升运营效率

5 天前

vivo启动‘蓝极星计划’,全球海选顶尖博士,薪资上不封顶

vivo推出“蓝极星”全球人才招募计划,聚焦高科技领域,旨在吸引顶尖博士生,推动技术创新。该计划涵盖多个技术岗位,提供丰富资源及高额薪酬,以提升公司竞争力。此举反映科技企业对顶尖人才的高度重视和激烈竞争态势

5 天前

高考AI志愿规划争议:靠谱AI指控优志愿涉嫌不实宣传

靠谱AI指控优志愿升学规划大模型存在虚假宣传,称优志愿声称的“全行业首个通过工信部备案”和“国内首发”不实。靠谱AI指出,其“靠谱大模型算法”备案时间早于优志愿,并要求优志愿停止虚假宣传并公开澄清事实,以维护市场秩序和消费者权益

5 天前

百度砸重金2亿打造山东AI新锐企业,战略布局迈入新阶段

百度宣布成立注册资本2亿元的百度(山东)科技有限公司,由北京百度网讯科技有限公司全资控股,业务范围覆盖人工智能软件开发、系统集成服务等领域,标志着百度在人工智能领域的持续深耕,并将为推动地方产业智能化升级贡献力量

5 天前

腾讯元宝插件尝鲜版:Chrome浏览器专属体验上线

腾讯近日推出腾讯元宝浏览器插件尝鲜版,已上线Chrome平台,并计划支持更多主流浏览器。该插件提供悬浮球功能,实现一键翻译、总结网页内容,以及收藏网页,同时具备侧边栏智能答疑和划词工具栏,优化用户网页浏览和信息处理体验。安装过程简便,用户可通过Chrome应用商店或腾讯元宝下载中心获取

5 天前

腾讯重磅更新:混元图像2.0将于5月16日全新亮相

腾讯混元大模型团队即将发布新一代多模态图像生成工具——混元图像2.0,标志着公司在AI视觉领域的又一重要进展,致力于推动视觉生产向AI驱动的新阶段转变

5 天前

可灵大模型视频生成独占30%市场:领先Runway,Poe报告揭示行业格局

Poe最新报告显示,快手可灵视频生成模型在文生视频领域市场份额达30%,领先于Runway和谷歌Veo2。可灵2.0模型自4月推出以来,市场份额迅速升至21%,全球用户突破2200万,月活跃用户增长25倍,显示出强大的市场影响力和应用潜力

5 天前

AlphaEvolve革新亮相:Gemini自进化AI攻克数学难关,引领芯片与数据中心革命,训练效率猛增32.5

谷歌DeepMind推出了一款名为AlphaEvolve的AI编码代理,结合Gemini大语言模型与进化算法,能自动发现和优化算法。该系统在数据中心优化、芯片设计、AI训练和数学研究领域取得显著成果,标志着AI技术迈向自进化新时代。AlphaEvolve具有广泛的应用潜力,未来可能在材料科学、药物发现等领域发挥重要作用

5 天前

Stability AI发布341M轻量级开源文本转语音模型,手机端实时运行,音频生成快至8秒

Stability AI与Arm合作开源推出轻量级文字转音频模型Stable Audio Open Small,参数仅为3.41亿,可在移动设备上本地快速生成高质量音频。该模型采用ARC技术,优化了推理速度,适合生成短音频样本,尤其适用于音效创作。项目遵循开源伦理,使用免版税数据集,对创作者权益予以尊重。此技术进步对移动AI和音频创作领域具有重大意义,同时提醒国内AI企业需加强端侧AI与开源生态建

5 天前

Swisscom 强强联手国家人工智能研究所,助力生成式 AI 技术突破

Swisscom 宣布加入瑞士国家人工智能研究所(SNAI),旨在推动瑞士AI领域创新,增强国家AI自主权,并与ETH Zurich和EPFL合作,提升AI算法透明性和效率

5 天前

前苹果工程师创立ElastixAI完成1600万美元融资,致力于提升大语言模型推理性能

ElastixAI,一家致力于优化大型语言模型部署的西雅图初创公司,已获得1600万美元融资,由FUSE领投。该公司由经验丰富的工程师创立,旨在提高AI推理的性能和效率,适应不同硬件配置。其目标是解决成本和复杂性挑战,服务于从云计算公司到企业客户的市场

5 天前

Opera全新AI代理助力,全球用户智能上网体验升级

Opera 浏览器,历经多年创新,推出基于 AI 代理的 Browser Operator 功能,以提升智能浏览体验。该浏览器覆盖多平台,Opera Mini 在低端设备上提供高效互联网接入,而内置 AI 助手 Aria 不断优化,支持多语言,满足全球用户需求

5 天前

Lightricks革新力作:LTX-Video-13B模型,10秒速成高清AI视频,实现速度与画质的双重突破

Lightricks推出开源AI视频生成模型LTX-Video-13B精炼版,以130亿参数实现10秒内生成高清视频,大幅提升生成速度与质量,降低硬件门槛,挑战行业现有技术,有望重塑内容创作生态

5 天前

微软 WizardLM 团队加盟腾讯,疑融入混元大模型研发阵列

腾讯AI实验室近日吸纳了原微软旗下位于北京的人工智能研究团队WizardLM,其核心成员已加入腾讯的“混元”团队,强化腾讯在大模型领域的竞争力。此举标志着腾讯在大模型研发及开源社区的活跃参与,旨在全球AI竞赛中占据主导地位。腾讯已宣布大幅增加AI领域的资本支出,以支持其战略升级。微软与腾讯双方尚未就此事发表公开声明

5 天前

美国学生怒揭AI代笔丑闻,退学费要求掀起教育界风波

一名学生发现其教授使用 ChatGPT 生成讲义,引发争议。该学生要求退还学费,但遭学校拒绝。教育工作者对此态度不一,有观点认为不应过度解读教授使用 AI 的行为。同时,职场中使用 AI 面临社会评价压力,其社会成本不容忽视

5 天前

上海人工智能标识生态联盟正式成立,小红书、MiniMax 等 industry 领军企业率先加盟

上海市成立“人工智能标识生态联盟”,旨在推动人工智能标识技术的发展,提高生成内容透明度和安全性。该联盟由上海市委网信办指导,上海人工智能安全治理实验室牵头,多家知名企业参与。此举措标志着我国在人工智能治理方面取得新进展,有助于促进行业自律和健康发展

5 天前

Chrome浏览器全新升级:Gemini AI助手集成,揭秘即将到来的革命性功能

谷歌宣布将在Windows 10和11的Chrome浏览器中集成Gemini AI助手,预示着其人工智能技术的进一步应用。该助手将提供个性化、智能化服务,并与浏览器侧边栏深度整合,预计2025年后推出更多高级功能,增强用户在线体验

5 天前

苹果创新技术:眼动追踪滚动功能,Vision Pro操作体验再升级

苹果公司正测试一项新眼动滚动功能,拟应用于Vision Pro头显,旨在提升用户浏览体验。该功能计划支持苹果内置应用,并将向第三方开发者开放。同时,Vision Pro现有的多样化操作方式将进一步优化用户交互。预计在即将到来的visionOS 3更新中,将有更多相关信息公布

5 天前

媒体在Meta反垄断审判中的角力升级:冲突持续加剧

在Meta的反垄断审判中,公司律师质疑媒体记者公信力,引发硅谷与媒体间紧张关系。审判揭示了科技巨头面对监管时的舆论压力,预计将持续引发公众关注。关键点包括媒体公信力质疑、记者负面评价作为证据,以及科技公司与舆论及监管的复杂互动

5 天前

微软Windows 11新增“Hey,Copilot!”免提唤醒功能测试

微软推出Windows11新免提功能“Hey,Copilot!”,允许用户通过语音指令唤醒Copilot应用程序,提升交互便利性。该功能已向部分Windows Insider用户推出,需更新至最新版本。此创新交互方式旨在增强用户体验,与现有语音助手相媲美

5 天前

通义千问升级新功能——'深入研究',加速科研效率提升

通义千问推出“深入研究”智能助理系统,通过高效便捷的研究支持,助力科研人员和用户快速生成可信研究报告。该系统结合海量互联网信息,实现多步骤研究流程自动化,提升研究效率和信息准确性,现已免费开放体验

5 天前

女性肿瘤检测迎来革命:全球首个人工智能大模型“木兰”免费手机端服务上线

华中科技大学联合研发的女性肿瘤人工智能大模型“木兰”已进入临床应用阶段,旨在提升女性肿瘤筛查和治疗水平,解决诊疗标准化和同质性问题。该模型基于大量病例数据和权威指南,适合中国女性需求,通过深度推理和多模态数据智能,为用户提供初步筛查和个性化诊疗建议,助力基层医生提升诊疗能力,推动医疗资源均衡配置

5 天前

Meta 新作 CATransformers 框架:AI 助力达成低碳减排新里程碑

本研究由Meta的FAIR团队与佐治亚理工学院合作,开发出CATransformers框架,旨在通过优化模型架构与硬件性能,显著降低AI技术的碳足迹,推动可持续AI发展。该框架通过多目标贝叶斯优化,平衡延迟、能耗、精度与总碳足迹,针对边缘推理设备进行了优化,并在实际应用中展示了性能与可持续性的双赢前景

5 天前

OpenAI 完善ChatGPT功能:GPT-4.1升级上线,代码编写能力大提升

OpenAI推出GPT-4.1及GPT-4.1mini,增强了ChatGPT的编码能力和指令执行体验,显著提升性能与效率。新模型特别适用于复杂编程任务和自动化指令处理,同时为免费和付费用户提供了更优化的访问渠道。此次更新标志着ChatGPT在AI领域的功能与性能跃升,进一步巩固了OpenAI的市场领导地位

5 天前

OpenAI升级发布GPT-4.1:编程辅助再上一层楼

OpenAI 发布 GPT-4.1模型,升级 ChatGPT 聊天机器人,显著提升编程任务处理能力,增强用户体验和输出质量,并向多用户群体开放访问权限

5 天前

Granola AI笔记应用完成4300万美元融资,致力于打造个人与企业知识管理核心平台

Granola,一款人工智能会议记录应用,自推出以来用户增长显著,已从简单的会议记录工具演变为用户整合个人与工作信息的AI助手。该应用近日完成4300万美元B轮融资,估值达到2.5亿美元,加速向团队协作场景扩展,推出新协作功能并升级AI问答功能。Granola的发展与行业趋势相符,正在向知识管理平台转型,并与生产力工具展开整合竞争,显示出其构建长期知识网络的潜力

5 天前

鸿海集团布局AI领域,重磅宣布自主ASIC芯片设计计划

鸿海集团宣布进入AI ASIC芯片设计市场,旨在把握人工智能技术发展机遇,实现从制造到技术方案提供商的转型,以推动高效能芯片在人工智能领域的应用

5 天前

Meta携手佐治亚理工打造CATransformers:创新AI框架助力减少碳排放

Meta与佐治亚理工学院合作研发的CATransformers框架,将碳排放作为AI系统设计的关键考量,通过联合优化模型架构与硬件性能,有效降低AI技术的碳足迹,为实现可持续AI发展提供了新路径。研究成果显示,该框架能减少19-20%的总碳排放,为AI领域的减排提供了重要策略

5 天前

DeepMind AlphaEvolve 创新突破:AI 首次刷新数学领域 56 年纪录,自主优化训练机制

谷歌 DeepMind 推出具备自我进化能力的人工智能 AlphaEvolve,能够自主发明算法并优化代码库。该系统已成功应用于数据中心、芯片设计和 AI 模型训练,显著提升效率,并在数学研究领域取得突破,解决了持续56年的难题。AlphaEvolve 通过进化式优化方法,展现了人工智能在科学发现和创造力方面的潜力

5 天前

可灵2.0模型惊艳表现,领跑全球视频生成大模型排名

快手可灵AI2.0模型以1124分刷新全球视频生成大模型榜单纪录,连续三个月位居行业之首,显著提升动态质量、语义理解及画面美学。自2023年6月上线以来,用户数突破2200万,月活用户增长25倍,生成视频及图片数量巨大,商业化进程取得显著成就,与多家知名品牌达成深度合作,推动中国AI大模型全球竞争地位的提升

5 天前

Step1X-3D:新一代开源3D模型引领AI行业革新,备受瞩目

科技界近日亮点频现,阶跃星辰Step1X-3D开源3D大模型发布,标志着AI技术在新领域的重要进展,并助力开发者创新。同时,小米申请“MiMo”商标,暗示其即将推出自主AI大模型,增强市场竞争力。新华都与香港理工大学共建AI实验室,加速AI技术研发与应用,预示AI技术将更深入地融入产业与日常生活

5 天前

Patronus AI 发布 Percival:快速定位代理链潜在问题,仅需一分钟

Patronus AI 推出 Percival,一款革命性的 AI 监控平台,能自动识别并修复自主运行 AI 代理系统中的故障。Percival 通过追踪代理轨迹,理解错误上下文,提供修复建议,显著提高故障分析效率。该产品已获得多个客户采用,并填补了 AI 监管工具市场的空白,预计将随着代理系统普及迎来市场增长

5 天前

清华联合面壁智能开源力作!国内首款中文GUI Agent应用震撼发布,全面支持高德、B站、小红书

清华大学THUNLP实验室与面壁智能联合推出全球首个针对中文APP优化的开源GUI Agent——AgentCPM-GUI,基于MiniCPM-V模型,具深度本地化适配能力,为安卓生态智能化升级提供新路径。该项目展现了国产AI技术实力,并致力于推动AI技术普惠化

6 天前

英伟达签署协议向沙特大规模输出1.8万块AI芯片

英伟达与沙特主权财富基金旗下AI初创公司Humain达成协议,将向沙特供应18,000块尖端AI芯片,以支持当地数据中心建设,标志着沙特在人工智能和云计算领域的重要进展。英伟达创始人黄仁勋强调,AI是国家基础设施的关键组成部分,此次合作旨在助力沙特实现科技发展愿景

6 天前

全新升级!PixVerse V4.5发布:一键融合电影镜头,5秒快速生成好莱坞级大片效果

PixVerse发布V4.5视频模型,引入20多项电影级镜头控制、多图参考功能,显著提升视频生成质量与创作自由度,被视作电影级AI视频创作的里程碑。该模型优化了复杂动作处理,适用于社交媒体、广告营销及影视动画制作,进一步巩固了PixVerse在AI视频生成领域的领先地位

6 天前

腾讯Q1营收增长13%达1800亿:AI赋能全面激活业务版图

腾讯控股2025年一季度报告显示,公司营收同比增长13%,毛利和经营利润同比增长均超过20%,盈利质量持续提升。多元业务结构有效应对经济波动,AI战略全面激活生态活力,推动营销服务、增值服务及金融科技与企业服务收入增长。一季度研发和资本开支均显著增加,强化了公司的核心竞争力

6 天前

AI快讯】腾讯发布智能编程助手CodeBuddy;字节跳动推出Seed1.5-VL多模态模型;Manus母公司澄清15亿美元融资疑云

AI日报摘要】: - 腾讯推出AI编程助手CodeBuddy,提升微信小程序开发效率。 - 字节跳动发布Seed1.5-VL多模态模型,38项任务达SOTA水平。 - Qwen团队开放“Deep Research”功能,免费提升科研效率。 - 蝴蝶效应否认15亿美元融资传闻,专注于产品研发。 - Devv2.0开启Private Beta,转型为开发者生产力工具。 - 苹果推出Matrix3D模型

6 天前

OpenMemory MCP全新发布:AI记忆本地共享升级,Claude与Cursor一键同步,工作效率翻倍提升

OpenMemory MCP,一款新型的AI本地记忆共享解决方案,已正式发布。该开源工具支持AI工具间的上下文同步,实现本地存储与跨工具共享,显著提升AI工作流效率。其核心功能包括统一本地存储、跨工具记忆共享、元数据增强及可视化仪表板。OpenMemory MCP以其隐私保护和技术优势迅速受到开发者关注,但也面临客户端兼容性及安装流程的挑战。此发布标志着AI记忆管理技术的竞争热潮,预示着AI工具向

6 天前

突破性AI工具Self-Refine:GPT-4效能猛增20%,告别繁复训练流程

Self-Refine方法通过自我批评与反思机制显著提升大语言模型输出质量,无需额外训练或工具即可实现约20%的性能提升,适用于包括GPT-4在内的先进模型。该方法通过三步循环提示法实现自我优化,显著提高代码优化、对话生成、文本生成等任务的表现。尽管Self-Refine具有自给自足的优势,但性能依赖基础模型能力,且迭代过程可能引入延迟与计算成本。该方法在自我优化领域竞争中以其通用性和无训练需求的

6 天前

开源突破!阶跃星辰发布 Step1X-3D:三维大模型的全新力作

阶跃星辰发布并开源了3D大模型Step1X-3D,实现了AI多模态技术的进一步拓展。该模型具有4.8B总参数量,采用3D原生架构,生成高保真、可控的3D内容,解决了数据、生成质量与可控性等关键挑战。Step1X-3D在几何与纹理表征上表现出色,提高了3D内容生成的可控性与易用性,并在综合测试中优于主流模型。该模型已在GitHub、HuggingFace和ModelScope开源平台发布

6 天前

Sam Altman亲述:OpenAI擘画AI操作系统新蓝图,语音识别与定制模型引领科技未来

OpenAI首席执行官Sam Altman在访谈中阐述了公司的高速发布节奏、产品战略和未来愿景。OpenAI致力于打造操作系统级别的AI平台,通过小团队运作、算法创新和语音技术突破,引领AI行业革新。Altman强调算法创新对未来的重要性,并关注年轻一代对ChatGPT的多样化使用方式,反映出AI从工具向生活核心的转变。OpenAI的操作系统愿景面临市场竞争和伦理挑战,但公司仍致力于在2025年前

6 天前

1.5亿下载!谷歌Gemma AI新引入多模态功能,掀起行业热议

谷歌推出的多模态人工智能模型 Gemma 下载量突破1.5亿次,凭借支持超100种语言的能力在AI领域受到广泛关注。Gemma 模型的成功体现在广泛的开发者社区接受度及其衍生版本数量。然而,其非标准许可条款引发商业应用担忧,强调了对AI使用条款的审慎评估需求

6 天前

Perplexity AI拟筹集5亿美元,估值猛增至140亿美元,向搜索行业巨头发起挑战

Perplexity AI正在进行一轮5亿美元的融资谈判,预计将公司估值提升至140亿美元,此轮融资由Accel领投。该公司凭借其AI驱动的搜索工具迅速崛起,挑战谷歌和OpenAI的市场地位。市场对AI重塑搜索领域的潜力表现出浓厚兴趣,Perplexity的核心竞争力在于其生成式AI搜索技术。在激烈的市场竞争中,该公司估值的大幅提升反映了市场对其发展前景的高度认可

6 天前

Anthropic力作Claude Neptune AI模型即将登场,挑战市场霸主地位

Anthropic公司正对其新AI模型Claude Neptune进行内部安全测试,以备与GPT-5和Gemini Ultra竞争。该模型的安全测试聚焦于抵御越狱攻击,预计将在5月底或6月初发布,届时将为市场带来新的竞争

6 天前

清华大学携手面壁智能打造端侧GUI智能体:AgentCPM-GUI震撼发布

清华大学THUNLP实验室与面壁智能合作研发的端侧GUI Agent——AgentCPM-GUI,采用8B参数的MiniCPM-V模型,支持中英文操作,具备强大的GUI元素定位和任务执行能力。该智能体覆盖30多个主流中文APP,通过RFT技术增强规划推理,显著提升用户体验和任务成功率,展现了端侧AI技术的突破与应用潜力

6 天前

革新上线!谷歌AI助手一键处理任务与文档,助您开发效率翻三倍

谷歌推出了一款名为“软件开发生命周期AI代理”的工具,旨在为软件工程师提供端到端的开发支持,涵盖任务规划、代码生成、自动化文档和问题排查等关键功能。该工具基于Gemini2.5的先进技术,预计将重塑开发效率,并在AI驱动开发工具领域引发竞争格局的变化

6 天前

字节Seed1.5-VL模型惊艳亮相:仅需20B参数,勇夺38项SOTA成就

字节跳动在上海的火山引擎 FORCE LINK AI 创新巡展上发布了Seed1.5-VL,一款具有卓越通用多模态理解和推理能力的视觉-语言模型。该模型在视觉定位、推理速度与准确性及视频理解等方面实现显著提升,并在38个任务上达到业界领先水平。Seed1.5-VL的推理成本低,已开放API供开发者快速构建AI应用

6 天前

Manus母公司蝴蝶效应启动1亿美元融资计划,目标估值冲破15亿美元大关

智能体产品Manus母公司蝴蝶效应计划新一轮1亿美元融资,估值达15亿美元,旨在拓展中国市场,预计将加速产品在国内的推广。此轮融资若成功,将为公司带来增长动能,增强中国AI市场产品竞争力

6 天前

蚂蚁数科力推企业级AI产品全球布局,助力海外市场智能化跃升

蚂蚁数科在国际市场推出旗下企业级AI产品,旨在助力海外市场客户的数字化与智能化升级。公司表示,其AI技术及行业实践将加速金融服务效率与体验的变革,并计划强化海外本土化运营策略。蚂蚁数科已在全球范围内服务超过1.3万家企业客户,并在迪拜金融科技峰会上展示了包括智能体开发平台Agentar、多端开发产品mPaaS及安全科技产品ZOLOZ在内的全栈AI产品矩阵。同时,公司也在探索web3领域,推出高性能

6 天前

字节跳动升级发布全新多模态大模型,对标谷歌 Gemini 2.5 Pro 技术挑战

字节跳动Seed团队发布多模态大模型Seed1.5-VL,经3万亿tokens预训练,展现卓越的多模态理解和推理能力,性能与谷歌Gemini2.5Pro相当,在60个基准测试中38个达到最优性能。模型适用于交互式应用,但在细粒度视觉感知和高层次推理任务上存在挑战。该模型已在火山引擎开放API供用户体验

6 天前

突破极限!Flow-GRPO助图像生成模型蜕变,技艺升级

Flow-GRPO 是一项创新性研究成果,通过将在线强化学习与流匹配图像生成模型相结合,显著提升了图像生成质量。该方法采用 ODE 到 SDE 转换和降噪减少策略,有效解决了流模型生成过程中的挑战,并在文本到图像任务中实现了显著的性能提升。Flow-GRPO 展现出强大的泛化能力和对复杂场景的处理能力,为图像和视频生成领域带来了新的突破和未来研究方向

6 天前

特朗普拟借助AI芯片技术优势 促进中东地区合作发展

特朗普政府计划放宽对沙特阿拉伯和阿联酋的AI芯片出口限制,以促进技术合作,并允许各国直接与美国谈判获取芯片。此政策与拜登政府时期限制措施形成对比,同时强调防止技术非法转移至中国,但仍保持与其他国家的合法交易

6 天前

Google Gemini AI 助手登陆 Wear OS 与 Google TV,升级跨设备智能交互体验

Google 宣布其新一代人工智能助手 Gemini 将登陆 Wear OS 智能手表和 Google TV,标志着其在多平台逐步取代 Google Assistant 的战略部署。此举将显著提升用户体验,实现更加便捷的智能互动,并增强设备间的互联互通,预计将为用户带来更丰富的功能性和更高的便利性

6 天前

英国政府启用AI工具‘Consult’助力公众咨询高效进行

英国政府推出人工智能工具Consult,用于分析公众咨询反馈,旨在提高效率、节约成本和时间。Consult已在苏格兰政府试用,成功识别关键主题,预计每年可为纳税人节省2000万英镑。专家提醒需关注AI偏见风险,并加强系统安全性与稳健性

6 天前

TikTok 新功能“AI Alive”:一键照片转视频,创意无限

TikTok 发布了创新AI工具“AI Alive”,允许用户将静态照片转化为动态视频,通过简单提示即可生成生动内容。该功能简化了视频制作流程,无需专业编辑技能。同时,TikTok采取了内容审核措施,确保生成视频符合社区政策,并标注AI生成内容以维护透明度

6 天前

Android Auto融合Gemini AI,升级智能车载新境界

谷歌宣布计划在未来几个月内将先进生成式人工智能模型Gemini整合至所有支持Android Auto的汽车中,随后亦将扩展至运行谷歌操作系统的汽车。此举旨在提升车载交互体验,通过更自然的语音助手和持续对话功能Gemini Live,实现更高效、有趣的驾驶体验,标志着车载技术的重大进步。同时,谷歌正与制造商合作增强车辆边缘计算能力,以提升性能和可靠性。该功能将在支持的国家和地区推出,覆盖超过40种语

6 天前

Google Gemini AI 助手跨平台升级,Wear OS与Google TV用户迎来智能新纪元

Google 宣布其最新人工智能助手 Gemini 将扩展至 Wear OS 智能手表和 Google TV,标志着其在多平台逐步取代 Google Assistant 的战略布局。此举旨在丰富用户体验,提供便捷的交互方式,并增强设备间的互联互通,预计将为用户带来更加个性化的内容推荐和高效的时间管理。同时,Gemini 的集成也将覆盖 Android XR 平台,进一步提升沉浸式设备的用户体验

6 天前

法律AI独角兽Harvey联手Anthropic与谷歌,突破对OpenAI单一依赖格局

法律人工智能平台Harvey宣布战略转变,将整合Anthropic和谷歌的基础模型,结束对OpenAI技术的单一依赖。此举标志着OpenAI竞争对手的重要进展,尽管Harvey仍视OpenAI为关键合作伙伴。Harvey的基准测试显示,不同模型在法律任务上的表现各异,推动公司采用多样化模型以提升AI代理能力,并计划公开模型性能排行榜

6 天前

腾讯混元联合科研机构发布首套多模态统一CoT奖励模型,全面开源助力科研创新

腾讯混元联合上海 AI Lab、复旦大学及上海创智学院推出统一多模态奖励模型(Unified Reward-Think),实现长链推理与视觉任务中的“思考”能力,全面开源以促进AI领域研究进展。该模型提升了视觉任务的评估准确性和推理能力,为多模态AI研究和应用开辟新方向

6 天前

Google革新Android Auto:Gemini智能助手上车,驾车体验升级

Google 宣布即将在支持 Android Auto 的汽车中整合其生成式人工智能助手 Gemini,预计将显著提升驾驶体验。Gemini 将作为智能语音助手,提供自然语言互动和记忆功能,以及创新的对话模式“双子座直播”,减轻驾驶员认知负担。Google 正解决技术挑战,计划提升车载计算能力,并扩展至全球多国及支持40种语言

6 天前

AI赋能新篇章:Devv2.0正式上线Private Beta,开发者工具全面升级

Devv 2.0,一款面向开发者的AI驱动的生产力工具,已进入Private Beta阶段,标志着其从AI搜索引擎向高效代码生成和部署工具的战略转型。该版本专注于自动化代码生成、调试和部署,旨在提升开发效率,并支持个性化工作流和无缝部署体验。Devv 2.0的推出正值AI编程工具市场竞争激烈,其全面覆盖开发周期的端到端解决方案,旨在提供一站式开发者体验,同时面临确保代码质量和安全性的挑战。未来,D

6 天前

腾讯AI编程新助手CodeBuddy:中国版Cursor革新亮相

腾讯发布CodeBuddy 3.0,一款与微信小程序开发工具深度整合的代码助手插件,旨在提升小程序开发效率。该插件支持智能代码补全、生成,并兼容多种开发环境,通过MCP协议和双模型支持增强执行能力和编码效率,为开发者生态带来新的活力

6 天前

腾讯混元T1-Vision升级:新增元宝功能,实现图片内容深度解析

腾讯混元T1-Vision新功能“元宝”上线,采用独特模型深度理解图片内容,快速提供精确解答与分析。该功能优化用户信息获取流程,提升准确性与效率,支持多场景应用,并具备深度思考功能,助力用户高效决策

8 天前

ChatGPT升级体验:全新PDF导出功能,助您打造完美深度研究报告

ChatGPT推出新功能,允许用户将深度研究报告直接导出为PDF格式,解决了格式丢失问题,提高了研究成果的分享便捷性。同时,OpenAI为深度研究功能新增了GitHub连接器,增强团队协作能力,优化用户体验和工作流程

8 天前

小红书重拳出击,严打AI技术滥用:严惩AI起号引流、倒卖AI账号行为

小红书宣布开展“清朗·整治AI技术滥用”专项行动,重点打击利用AI生成虚假内容、涨粉、引流带货等违规行为,已清理违规内容265条,并对13个违规用户实施禁言。平台将持续提升AI内容治理能力,并鼓励用户参与共治,共同营造健康网络环境

8 天前

NVIDIA AI创新力作:Audio-SDS引领音效生成与多任务音频处理革命

NVIDIA AI研究团队推出Audio-SDS技术,将SDS扩展至音频领域,实现了音频扩散模型的多任务处理能力,显著提升音效生成、音源分离等任务性能。该技术无需重新训练即可适用于多种音频处理需求,并通过文本条件控制实现高度定制化音效设计,已在学术界和工业界引发广泛关注

8 天前

自变量机器人”突破性进展:国内首创新型通用具身智能大模型,筹集数亿元巨额融资

自变量机器人宣布完成Pre-A+++轮和A轮融资,总计数亿元,由华映资本和美团领投。公司致力于研发通用具身智能大模型,通过深度学习与机器人技术结合,实现机器人在复杂环境中的自主交互和高效任务执行。核心技术“WALL-A”大模型系列具备多模态信息融合和零样本泛化能力。融资将用于推动模型迭代和拓展应用场景,自变量机器人有望在具身智能领域成为领先者

8 天前

南智光电突破创新:国内首款光子芯片专用大模型引领智能研发新风向

南智光电发布国内首个光子芯片专用大模型OptoChat AI,通过深度训练30万份权威文献和工艺数据,覆盖光子芯片研发全环节,显著提升研发效率,助力我国光子芯片产业发展,构建完整产业生态,增强半导体行业国际竞争力

8 天前

苹果创新推出iPhone兼容FastVLM模型,实现极速视觉语言处理

苹果公司推出FastVLM,一款针对高分辨率图像处理的高效视觉语言模型,显著提升移动设备上的AI性能。FastVLM采用FastViTHD编码器,实现85倍编码速度提升,并优化硬件兼容性,适用于多种应用场景。模型在多项基准测试中表现优异,且已开源,标志着苹果在移动端AI领域的战略进展

8 天前

苹果力作!FastVLM 助iPhone实现视觉语言模型的飞速突破

苹果公司近日推出FastVLM模型,显著提升视觉语言模型的运行效率,使iPhone能够快速识别图像内容并进行自然语言交互。FastVLM采用FastViTHD混合视觉编码器,优化了高分辨率图像处理的速度和准确性,实现了比现有模型快85倍的响应速度。该模型在多个基准测试中表现出色,为视觉语言模型领域带来新的发展潜力,并预示着未来智能应用将更加高效便捷。相关研究已发布于arXiv,并开放了项目代码

8 天前

Kimi亮相小红书,AI大模型战略转型:从流量竞争迈向内容精耕

月之暗面旗下大模型产品Kimi与小红书合作,上线对话入口,用户可生成笔记。此举为Kimi在流量焦虑下的转型尝试,从“买量驱动”转向“内容+社区”策略。Kimi正探索社交关系以增强用户黏性,但双方产品生态的深入整合尚待观察

8 天前

探秘机器人时代:人类角色的崭新篇章

本文讨论了自动化对劳动力市场的影响,指出尽管技术进步可能导致部分职位消失,但也预计将创造更多新工作岗位。亚马逊的新型Vulcan机器人旨在提升工作安全并培训员工新技能,预示着机器人与人类协作的新趋势。同时,新型职业如“自动化监控员”将出现,而传统行业在可预见的未来仍将依赖人类劳动力

8 天前

中科院团队创新成果:MCA-Ctrl技术掀起AI图像定制化革命

中国科学院计算技术研究所研究团队开发的MCA-Ctrl技术,为文本到图像生成领域带来革命性变革,通过独特的协同注意力控制机制,实现高度个性化图像生成。该技术显著提升图像定制的灵活性和效率,解决了可控性不足、复杂场景处理和背景融合等关键技术难题,对电子商务、广告营销等领域具有重大应用价值,并预示着个性化图像创作新时代的到来

8 天前

Reddit加强用户身份验证以应对AI实验挑战

Reddit 对苏黎世大学研究人员未经授权的 AI 实验实施禁令,该实验涉嫌在平台匿名发表虚假身份评论以影响用户观点。事件引发社区强烈反响,Reddit 官方予以谴责并封禁相关账户,计划推出身份验证工具以保障真实交流及用户隐私

8 天前

Momos AI平台推动北美1350家餐厅创新升级,引领餐饮业变革

Momos公司的人工智能客户助理平台已在北美1350家火屋潜水艇餐厅上线,提供全面的客户管理解决方案,助力餐厅数字化转型。火屋潜水艇通过与Momos的合作,实现了品牌形象的提升和顾客体验的优化,展示了科技与服务结合的价值

8 天前

Recraft 力压群雄,3000 万美元 B 轮融资助力图像生成技术挑战行业领先企业

Recraft 完成由 Accel 领投的3000万美元B轮融资,年化经常性收入突破500万美元,用户量达400万。其图像生成模型“red_panda”在行业基准测试中领先,彰显公司在AI图像生成领域的核心竞争力。公司创始人多罗古什凭借深厚的技术背景和市场洞察,推动Recraft在激烈竞争中脱颖而出

14 天前

阿里通义Qwen3语言模型震撼发布,开源实力迈向新高度

通义宣布开源大型语言模型Qwen3,其旗舰模型Qwen3-235B-A22B在基准测试中表现出色,超越多个顶级模型,支持119种语言,满足全球需求。Qwen3系列模型的开源将推动研究与发展,提供多样化的应用场景和部署选项

14 天前

探秘月之暗面:Kimi长思考模型API震撼上线

月之暗面科技有限公司发布kimi-thinking-preview,一款具有深度推理和多模态支持的长思考模型API,旨在解决复杂问题并提供透明的推理过程。该模型API支持流式输出和多轮对话,但目前存在一定限制,公司已提供使用最佳实践。此发布标志着公司在AI推理领域的显著进展

14 天前

IBM CEO 重磅布局:全面挺进人工智能领域,大幅增强美国市场投资

IBM 首席执行官阿尔温德・克里希纳宣布,公司将通过推出整合不同 AI 代理的软件工具以增强市场竞争力,并计划在未来五年内向美国市场投资1500亿美元,同时致力于在美国制造量子计算机,以推动业务增长和技术布局

14 天前

全新升级!LLaMA-Omni 2 实时口语聊天模型,AI聊天体验全面飞跃

本文介绍了LLaMA-Omni2系列端到端的语音语言模型,旨在实现高质量的实时语音交互。该模型结合了Whisper编码器和CosyVoice2模型,通过分阶段训练策略,显著提升了语音到语音的交互性能。实验结果表明,LLaMA-Omni2在口语问答和语音指令跟随任务中优于基线系统,展现了其在实时语音交互领域的巨大潜力。尽管存在一定局限性,但该模型为未来语音交互技术的发展提供了新的方向

14 天前

SD?ACE-Step革命性音乐生成模型问世,20秒内快速创作4分钟完整曲目

ACE-Step,一款由ACE Studio与StepFun共同开发的AI音乐生成模型,近日推出,以其20秒内生成4分钟完整音乐作品的惊人速度和多语言支持功能受到关注。该模型具备从歌词到完整歌曲的一键生成能力,支持多样化音乐风格,并在GitHub上开源,为音乐创作提供高效便捷的解决方案,预示着AI音乐创作领域的新趋势

14 天前

腾讯元宝全新升级:对话分组功能全平台同步,免费不限次数畅享

腾讯元宝推出「对话分组」功能,旨在优化用户对话管理,通过创建分类文件夹,提升用户体验。该功能支持对话分类、历史对话迁移及个性化设置,使用户能高效定位和管理聊天内容。目前已全面免费上线

14 天前

商汤科技强强联手中国移动香港及香港中文大学法学院,共拓视觉AI与大模型领域新合作

商汤科技与香港移动及中文大学法学院签署备忘录,启动视觉人工智能与大数据技术合作,旨在推动科技创新、扩展市场应用,并确保符合法律伦理标准,促进香港科技与法治环境协同发展

14 天前

马斯克坚持诉讼OpenAI,新战略成为关注核心

美国亿万富翁埃隆·马斯克因不满 OpenAI 转变为营利性公司的计划,持续提起诉讼。尽管 OpenAI 已宣布调整运营模式,马斯克仍坚持诉讼,反映其对人工智能安全性和可控性的关切。此法律争斗将影响人工智能领域的未来研究和应用,预计2026年3月进入陪审团审判阶段

14 天前

Perplexity AI 发布革命性 Comet 浏览器,剑指 Chrome 霸主之位

Perplexity AI 即将推出其AI驱动的Comet浏览器,旨在挑战Google Chrome市场地位,通过AI技术提升用户搜索效率,并配备隐私设置以保障用户数据安全

14 天前

惊曝:非学生用户也可免费畅享谷歌顶级AI全家桶,速领白嫖攻略

谷歌旗下AI服务Gemini Advanced出现订阅系统漏洞,允许用户免费获取价值300美元/年的学生特权套餐,包含高级AI功能及2TB云存储,但仅限美国地区18岁以上学生,并需在规定时间内完成身份验证。该漏洞存在潜在风险,需谨慎使用

14 天前

马斯克坚持对OpenAI提起诉讼,纠纷持续发酵中

美国亿万富翁埃隆·马斯克持续对人工智能公司OpenAI发起诉讼,指出其商业化进程与初衷相悖。尽管OpenAI调整运营模式,但马斯克不满依旧,双方争议持续升级。诉讼定于2026年3月审理,案件备受业界关注

14 天前

芝浦工大研发Vote-based新框架,显著增强手持物体姿态估计准确性

芝浦工业大学研究团队开发了一种基于Vote机制的多模态融合框架,显著提升了手持物体姿态估计的准确性,尤其在手部遮挡情况下。该框架整合RGB和深度图像数据,通过深度学习技术优化姿态估计,实现了13.9%的精度提升,并展现出良好的实用性和部署潜力,为AR/VR技术的应用提供了新的可能性

14 天前
Sitemap.xml
© 2025 Juhe.ai
西安指尖漫步科技有限公司