AI最新资讯

不错过全球每一个AI革命的瞬间

最新资讯

Granola AI笔记应用完成4300万美元融资,致力于打造个人与企业知识管理核心平台

Granola,一款人工智能会议记录应用,自推出以来用户增长显著,已从简单的会议记录工具演变为用户整合个人与工作信息的AI助手。该应用近日完成4300万美元B轮融资,估值达到2.5亿美元,加速向团队协作场景扩展,推出新协作功能并升级AI问答功能。Granola的发展与行业趋势相符,正在向知识管理平台转型,并与生产力工具展开整合竞争,显示出其构建长期知识网络的潜力

1 个月前

鸿海集团布局AI领域,重磅宣布自主ASIC芯片设计计划

鸿海集团宣布进入AI ASIC芯片设计市场,旨在把握人工智能技术发展机遇,实现从制造到技术方案提供商的转型,以推动高效能芯片在人工智能领域的应用

1 个月前

Meta携手佐治亚理工打造CATransformers:创新AI框架助力减少碳排放

Meta与佐治亚理工学院合作研发的CATransformers框架,将碳排放作为AI系统设计的关键考量,通过联合优化模型架构与硬件性能,有效降低AI技术的碳足迹,为实现可持续AI发展提供了新路径。研究成果显示,该框架能减少19-20%的总碳排放,为AI领域的减排提供了重要策略

1 个月前

DeepMind AlphaEvolve 创新突破:AI 首次刷新数学领域 56 年纪录,自主优化训练机制

谷歌 DeepMind 推出具备自我进化能力的人工智能 AlphaEvolve,能够自主发明算法并优化代码库。该系统已成功应用于数据中心、芯片设计和 AI 模型训练,显著提升效率,并在数学研究领域取得突破,解决了持续56年的难题。AlphaEvolve 通过进化式优化方法,展现了人工智能在科学发现和创造力方面的潜力

1 个月前

可灵2.0模型惊艳表现,领跑全球视频生成大模型排名

快手可灵AI2.0模型以1124分刷新全球视频生成大模型榜单纪录,连续三个月位居行业之首,显著提升动态质量、语义理解及画面美学。自2023年6月上线以来,用户数突破2200万,月活用户增长25倍,生成视频及图片数量巨大,商业化进程取得显著成就,与多家知名品牌达成深度合作,推动中国AI大模型全球竞争地位的提升

1 个月前

Step1X-3D:新一代开源3D模型引领AI行业革新,备受瞩目

科技界近日亮点频现,阶跃星辰Step1X-3D开源3D大模型发布,标志着AI技术在新领域的重要进展,并助力开发者创新。同时,小米申请“MiMo”商标,暗示其即将推出自主AI大模型,增强市场竞争力。新华都与香港理工大学共建AI实验室,加速AI技术研发与应用,预示AI技术将更深入地融入产业与日常生活

1 个月前

Patronus AI 发布 Percival:快速定位代理链潜在问题,仅需一分钟

Patronus AI 推出 Percival,一款革命性的 AI 监控平台,能自动识别并修复自主运行 AI 代理系统中的故障。Percival 通过追踪代理轨迹,理解错误上下文,提供修复建议,显著提高故障分析效率。该产品已获得多个客户采用,并填补了 AI 监管工具市场的空白,预计将随着代理系统普及迎来市场增长

1 个月前

清华联合面壁智能开源力作!国内首款中文GUI Agent应用震撼发布,全面支持高德、B站、小红书

清华大学THUNLP实验室与面壁智能联合推出全球首个针对中文APP优化的开源GUI Agent——AgentCPM-GUI,基于MiniCPM-V模型,具深度本地化适配能力,为安卓生态智能化升级提供新路径。该项目展现了国产AI技术实力,并致力于推动AI技术普惠化

1 个月前

英伟达签署协议向沙特大规模输出1.8万块AI芯片

英伟达与沙特主权财富基金旗下AI初创公司Humain达成协议,将向沙特供应18,000块尖端AI芯片,以支持当地数据中心建设,标志着沙特在人工智能和云计算领域的重要进展。英伟达创始人黄仁勋强调,AI是国家基础设施的关键组成部分,此次合作旨在助力沙特实现科技发展愿景

1 个月前

全新升级!PixVerse V4.5发布:一键融合电影镜头,5秒快速生成好莱坞级大片效果

PixVerse发布V4.5视频模型,引入20多项电影级镜头控制、多图参考功能,显著提升视频生成质量与创作自由度,被视作电影级AI视频创作的里程碑。该模型优化了复杂动作处理,适用于社交媒体、广告营销及影视动画制作,进一步巩固了PixVerse在AI视频生成领域的领先地位

1 个月前

腾讯Q1营收增长13%达1800亿:AI赋能全面激活业务版图

腾讯控股2025年一季度报告显示,公司营收同比增长13%,毛利和经营利润同比增长均超过20%,盈利质量持续提升。多元业务结构有效应对经济波动,AI战略全面激活生态活力,推动营销服务、增值服务及金融科技与企业服务收入增长。一季度研发和资本开支均显著增加,强化了公司的核心竞争力

1 个月前

AI快讯】腾讯发布智能编程助手CodeBuddy;字节跳动推出Seed1.5-VL多模态模型;Manus母公司澄清15亿美元融资疑云

AI日报摘要】: - 腾讯推出AI编程助手CodeBuddy,提升微信小程序开发效率。 - 字节跳动发布Seed1.5-VL多模态模型,38项任务达SOTA水平。 - Qwen团队开放“Deep Research”功能,免费提升科研效率。 - 蝴蝶效应否认15亿美元融资传闻,专注于产品研发。 - Devv2.0开启Private Beta,转型为开发者生产力工具。 - 苹果推出Matrix3D模型

1 个月前

OpenMemory MCP全新发布:AI记忆本地共享升级,Claude与Cursor一键同步,工作效率翻倍提升

OpenMemory MCP,一款新型的AI本地记忆共享解决方案,已正式发布。该开源工具支持AI工具间的上下文同步,实现本地存储与跨工具共享,显著提升AI工作流效率。其核心功能包括统一本地存储、跨工具记忆共享、元数据增强及可视化仪表板。OpenMemory MCP以其隐私保护和技术优势迅速受到开发者关注,但也面临客户端兼容性及安装流程的挑战。此发布标志着AI记忆管理技术的竞争热潮,预示着AI工具向

1 个月前

突破性AI工具Self-Refine:GPT-4效能猛增20%,告别繁复训练流程

Self-Refine方法通过自我批评与反思机制显著提升大语言模型输出质量,无需额外训练或工具即可实现约20%的性能提升,适用于包括GPT-4在内的先进模型。该方法通过三步循环提示法实现自我优化,显著提高代码优化、对话生成、文本生成等任务的表现。尽管Self-Refine具有自给自足的优势,但性能依赖基础模型能力,且迭代过程可能引入延迟与计算成本。该方法在自我优化领域竞争中以其通用性和无训练需求的

1 个月前

开源突破!阶跃星辰发布 Step1X-3D:三维大模型的全新力作

阶跃星辰发布并开源了3D大模型Step1X-3D,实现了AI多模态技术的进一步拓展。该模型具有4.8B总参数量,采用3D原生架构,生成高保真、可控的3D内容,解决了数据、生成质量与可控性等关键挑战。Step1X-3D在几何与纹理表征上表现出色,提高了3D内容生成的可控性与易用性,并在综合测试中优于主流模型。该模型已在GitHub、HuggingFace和ModelScope开源平台发布

1 个月前

Sam Altman亲述:OpenAI擘画AI操作系统新蓝图,语音识别与定制模型引领科技未来

OpenAI首席执行官Sam Altman在访谈中阐述了公司的高速发布节奏、产品战略和未来愿景。OpenAI致力于打造操作系统级别的AI平台,通过小团队运作、算法创新和语音技术突破,引领AI行业革新。Altman强调算法创新对未来的重要性,并关注年轻一代对ChatGPT的多样化使用方式,反映出AI从工具向生活核心的转变。OpenAI的操作系统愿景面临市场竞争和伦理挑战,但公司仍致力于在2025年前

1 个月前

1.5亿下载!谷歌Gemma AI新引入多模态功能,掀起行业热议

谷歌推出的多模态人工智能模型 Gemma 下载量突破1.5亿次,凭借支持超100种语言的能力在AI领域受到广泛关注。Gemma 模型的成功体现在广泛的开发者社区接受度及其衍生版本数量。然而,其非标准许可条款引发商业应用担忧,强调了对AI使用条款的审慎评估需求

1 个月前

Perplexity AI拟筹集5亿美元,估值猛增至140亿美元,向搜索行业巨头发起挑战

Perplexity AI正在进行一轮5亿美元的融资谈判,预计将公司估值提升至140亿美元,此轮融资由Accel领投。该公司凭借其AI驱动的搜索工具迅速崛起,挑战谷歌和OpenAI的市场地位。市场对AI重塑搜索领域的潜力表现出浓厚兴趣,Perplexity的核心竞争力在于其生成式AI搜索技术。在激烈的市场竞争中,该公司估值的大幅提升反映了市场对其发展前景的高度认可

1 个月前

Anthropic力作Claude Neptune AI模型即将登场,挑战市场霸主地位

Anthropic公司正对其新AI模型Claude Neptune进行内部安全测试,以备与GPT-5和Gemini Ultra竞争。该模型的安全测试聚焦于抵御越狱攻击,预计将在5月底或6月初发布,届时将为市场带来新的竞争

1 个月前

清华大学携手面壁智能打造端侧GUI智能体:AgentCPM-GUI震撼发布

清华大学THUNLP实验室与面壁智能合作研发的端侧GUI Agent——AgentCPM-GUI,采用8B参数的MiniCPM-V模型,支持中英文操作,具备强大的GUI元素定位和任务执行能力。该智能体覆盖30多个主流中文APP,通过RFT技术增强规划推理,显著提升用户体验和任务成功率,展现了端侧AI技术的突破与应用潜力

1 个月前

革新上线!谷歌AI助手一键处理任务与文档,助您开发效率翻三倍

谷歌推出了一款名为“软件开发生命周期AI代理”的工具,旨在为软件工程师提供端到端的开发支持,涵盖任务规划、代码生成、自动化文档和问题排查等关键功能。该工具基于Gemini2.5的先进技术,预计将重塑开发效率,并在AI驱动开发工具领域引发竞争格局的变化

1 个月前

字节Seed1.5-VL模型惊艳亮相:仅需20B参数,勇夺38项SOTA成就

字节跳动在上海的火山引擎 FORCE LINK AI 创新巡展上发布了Seed1.5-VL,一款具有卓越通用多模态理解和推理能力的视觉-语言模型。该模型在视觉定位、推理速度与准确性及视频理解等方面实现显著提升,并在38个任务上达到业界领先水平。Seed1.5-VL的推理成本低,已开放API供开发者快速构建AI应用

1 个月前

Manus母公司蝴蝶效应启动1亿美元融资计划,目标估值冲破15亿美元大关

智能体产品Manus母公司蝴蝶效应计划新一轮1亿美元融资,估值达15亿美元,旨在拓展中国市场,预计将加速产品在国内的推广。此轮融资若成功,将为公司带来增长动能,增强中国AI市场产品竞争力

1 个月前

蚂蚁数科力推企业级AI产品全球布局,助力海外市场智能化跃升

蚂蚁数科在国际市场推出旗下企业级AI产品,旨在助力海外市场客户的数字化与智能化升级。公司表示,其AI技术及行业实践将加速金融服务效率与体验的变革,并计划强化海外本土化运营策略。蚂蚁数科已在全球范围内服务超过1.3万家企业客户,并在迪拜金融科技峰会上展示了包括智能体开发平台Agentar、多端开发产品mPaaS及安全科技产品ZOLOZ在内的全栈AI产品矩阵。同时,公司也在探索web3领域,推出高性能

1 个月前

字节跳动升级发布全新多模态大模型,对标谷歌 Gemini 2.5 Pro 技术挑战

字节跳动Seed团队发布多模态大模型Seed1.5-VL,经3万亿tokens预训练,展现卓越的多模态理解和推理能力,性能与谷歌Gemini2.5Pro相当,在60个基准测试中38个达到最优性能。模型适用于交互式应用,但在细粒度视觉感知和高层次推理任务上存在挑战。该模型已在火山引擎开放API供用户体验

1 个月前

突破极限!Flow-GRPO助图像生成模型蜕变,技艺升级

Flow-GRPO 是一项创新性研究成果,通过将在线强化学习与流匹配图像生成模型相结合,显著提升了图像生成质量。该方法采用 ODE 到 SDE 转换和降噪减少策略,有效解决了流模型生成过程中的挑战,并在文本到图像任务中实现了显著的性能提升。Flow-GRPO 展现出强大的泛化能力和对复杂场景的处理能力,为图像和视频生成领域带来了新的突破和未来研究方向

1 个月前

特朗普拟借助AI芯片技术优势 促进中东地区合作发展

特朗普政府计划放宽对沙特阿拉伯和阿联酋的AI芯片出口限制,以促进技术合作,并允许各国直接与美国谈判获取芯片。此政策与拜登政府时期限制措施形成对比,同时强调防止技术非法转移至中国,但仍保持与其他国家的合法交易

1 个月前

Google Gemini AI 助手登陆 Wear OS 与 Google TV,升级跨设备智能交互体验

Google 宣布其新一代人工智能助手 Gemini 将登陆 Wear OS 智能手表和 Google TV,标志着其在多平台逐步取代 Google Assistant 的战略部署。此举将显著提升用户体验,实现更加便捷的智能互动,并增强设备间的互联互通,预计将为用户带来更丰富的功能性和更高的便利性

1 个月前

英国政府启用AI工具‘Consult’助力公众咨询高效进行

英国政府推出人工智能工具Consult,用于分析公众咨询反馈,旨在提高效率、节约成本和时间。Consult已在苏格兰政府试用,成功识别关键主题,预计每年可为纳税人节省2000万英镑。专家提醒需关注AI偏见风险,并加强系统安全性与稳健性

1 个月前

TikTok 新功能“AI Alive”:一键照片转视频,创意无限

TikTok 发布了创新AI工具“AI Alive”,允许用户将静态照片转化为动态视频,通过简单提示即可生成生动内容。该功能简化了视频制作流程,无需专业编辑技能。同时,TikTok采取了内容审核措施,确保生成视频符合社区政策,并标注AI生成内容以维护透明度

1 个月前

Android Auto融合Gemini AI,升级智能车载新境界

谷歌宣布计划在未来几个月内将先进生成式人工智能模型Gemini整合至所有支持Android Auto的汽车中,随后亦将扩展至运行谷歌操作系统的汽车。此举旨在提升车载交互体验,通过更自然的语音助手和持续对话功能Gemini Live,实现更高效、有趣的驾驶体验,标志着车载技术的重大进步。同时,谷歌正与制造商合作增强车辆边缘计算能力,以提升性能和可靠性。该功能将在支持的国家和地区推出,覆盖超过40种语

1 个月前

Google Gemini AI 助手跨平台升级,Wear OS与Google TV用户迎来智能新纪元

Google 宣布其最新人工智能助手 Gemini 将扩展至 Wear OS 智能手表和 Google TV,标志着其在多平台逐步取代 Google Assistant 的战略布局。此举旨在丰富用户体验,提供便捷的交互方式,并增强设备间的互联互通,预计将为用户带来更加个性化的内容推荐和高效的时间管理。同时,Gemini 的集成也将覆盖 Android XR 平台,进一步提升沉浸式设备的用户体验

1 个月前

法律AI独角兽Harvey联手Anthropic与谷歌,突破对OpenAI单一依赖格局

法律人工智能平台Harvey宣布战略转变,将整合Anthropic和谷歌的基础模型,结束对OpenAI技术的单一依赖。此举标志着OpenAI竞争对手的重要进展,尽管Harvey仍视OpenAI为关键合作伙伴。Harvey的基准测试显示,不同模型在法律任务上的表现各异,推动公司采用多样化模型以提升AI代理能力,并计划公开模型性能排行榜

1 个月前

腾讯混元联合科研机构发布首套多模态统一CoT奖励模型,全面开源助力科研创新

腾讯混元联合上海 AI Lab、复旦大学及上海创智学院推出统一多模态奖励模型(Unified Reward-Think),实现长链推理与视觉任务中的“思考”能力,全面开源以促进AI领域研究进展。该模型提升了视觉任务的评估准确性和推理能力,为多模态AI研究和应用开辟新方向

1 个月前

Google革新Android Auto:Gemini智能助手上车,驾车体验升级

Google 宣布即将在支持 Android Auto 的汽车中整合其生成式人工智能助手 Gemini,预计将显著提升驾驶体验。Gemini 将作为智能语音助手,提供自然语言互动和记忆功能,以及创新的对话模式“双子座直播”,减轻驾驶员认知负担。Google 正解决技术挑战,计划提升车载计算能力,并扩展至全球多国及支持40种语言

1 个月前

AI赋能新篇章:Devv2.0正式上线Private Beta,开发者工具全面升级

Devv 2.0,一款面向开发者的AI驱动的生产力工具,已进入Private Beta阶段,标志着其从AI搜索引擎向高效代码生成和部署工具的战略转型。该版本专注于自动化代码生成、调试和部署,旨在提升开发效率,并支持个性化工作流和无缝部署体验。Devv 2.0的推出正值AI编程工具市场竞争激烈,其全面覆盖开发周期的端到端解决方案,旨在提供一站式开发者体验,同时面临确保代码质量和安全性的挑战。未来,D

1 个月前

腾讯AI编程新助手CodeBuddy:中国版Cursor革新亮相

腾讯发布CodeBuddy 3.0,一款与微信小程序开发工具深度整合的代码助手插件,旨在提升小程序开发效率。该插件支持智能代码补全、生成,并兼容多种开发环境,通过MCP协议和双模型支持增强执行能力和编码效率,为开发者生态带来新的活力

1 个月前

腾讯混元T1-Vision升级:新增元宝功能,实现图片内容深度解析

腾讯混元T1-Vision新功能“元宝”上线,采用独特模型深度理解图片内容,快速提供精确解答与分析。该功能优化用户信息获取流程,提升准确性与效率,支持多场景应用,并具备深度思考功能,助力用户高效决策

1 个月前

ChatGPT升级体验:全新PDF导出功能,助您打造完美深度研究报告

ChatGPT推出新功能,允许用户将深度研究报告直接导出为PDF格式,解决了格式丢失问题,提高了研究成果的分享便捷性。同时,OpenAI为深度研究功能新增了GitHub连接器,增强团队协作能力,优化用户体验和工作流程

1 个月前

小红书重拳出击,严打AI技术滥用:严惩AI起号引流、倒卖AI账号行为

小红书宣布开展“清朗·整治AI技术滥用”专项行动,重点打击利用AI生成虚假内容、涨粉、引流带货等违规行为,已清理违规内容265条,并对13个违规用户实施禁言。平台将持续提升AI内容治理能力,并鼓励用户参与共治,共同营造健康网络环境

1 个月前

NVIDIA AI创新力作:Audio-SDS引领音效生成与多任务音频处理革命

NVIDIA AI研究团队推出Audio-SDS技术,将SDS扩展至音频领域,实现了音频扩散模型的多任务处理能力,显著提升音效生成、音源分离等任务性能。该技术无需重新训练即可适用于多种音频处理需求,并通过文本条件控制实现高度定制化音效设计,已在学术界和工业界引发广泛关注

1 个月前

自变量机器人”突破性进展:国内首创新型通用具身智能大模型,筹集数亿元巨额融资

自变量机器人宣布完成Pre-A+++轮和A轮融资,总计数亿元,由华映资本和美团领投。公司致力于研发通用具身智能大模型,通过深度学习与机器人技术结合,实现机器人在复杂环境中的自主交互和高效任务执行。核心技术“WALL-A”大模型系列具备多模态信息融合和零样本泛化能力。融资将用于推动模型迭代和拓展应用场景,自变量机器人有望在具身智能领域成为领先者

1 个月前

南智光电突破创新:国内首款光子芯片专用大模型引领智能研发新风向

南智光电发布国内首个光子芯片专用大模型OptoChat AI,通过深度训练30万份权威文献和工艺数据,覆盖光子芯片研发全环节,显著提升研发效率,助力我国光子芯片产业发展,构建完整产业生态,增强半导体行业国际竞争力

1 个月前

苹果创新推出iPhone兼容FastVLM模型,实现极速视觉语言处理

苹果公司推出FastVLM,一款针对高分辨率图像处理的高效视觉语言模型,显著提升移动设备上的AI性能。FastVLM采用FastViTHD编码器,实现85倍编码速度提升,并优化硬件兼容性,适用于多种应用场景。模型在多项基准测试中表现优异,且已开源,标志着苹果在移动端AI领域的战略进展

1 个月前

苹果力作!FastVLM 助iPhone实现视觉语言模型的飞速突破

苹果公司近日推出FastVLM模型,显著提升视觉语言模型的运行效率,使iPhone能够快速识别图像内容并进行自然语言交互。FastVLM采用FastViTHD混合视觉编码器,优化了高分辨率图像处理的速度和准确性,实现了比现有模型快85倍的响应速度。该模型在多个基准测试中表现出色,为视觉语言模型领域带来新的发展潜力,并预示着未来智能应用将更加高效便捷。相关研究已发布于arXiv,并开放了项目代码

1 个月前

Kimi亮相小红书,AI大模型战略转型:从流量竞争迈向内容精耕

月之暗面旗下大模型产品Kimi与小红书合作,上线对话入口,用户可生成笔记。此举为Kimi在流量焦虑下的转型尝试,从“买量驱动”转向“内容+社区”策略。Kimi正探索社交关系以增强用户黏性,但双方产品生态的深入整合尚待观察

1 个月前

探秘机器人时代:人类角色的崭新篇章

本文讨论了自动化对劳动力市场的影响,指出尽管技术进步可能导致部分职位消失,但也预计将创造更多新工作岗位。亚马逊的新型Vulcan机器人旨在提升工作安全并培训员工新技能,预示着机器人与人类协作的新趋势。同时,新型职业如“自动化监控员”将出现,而传统行业在可预见的未来仍将依赖人类劳动力

1 个月前

中科院团队创新成果:MCA-Ctrl技术掀起AI图像定制化革命

中国科学院计算技术研究所研究团队开发的MCA-Ctrl技术,为文本到图像生成领域带来革命性变革,通过独特的协同注意力控制机制,实现高度个性化图像生成。该技术显著提升图像定制的灵活性和效率,解决了可控性不足、复杂场景处理和背景融合等关键技术难题,对电子商务、广告营销等领域具有重大应用价值,并预示着个性化图像创作新时代的到来

1 个月前

Reddit加强用户身份验证以应对AI实验挑战

Reddit 对苏黎世大学研究人员未经授权的 AI 实验实施禁令,该实验涉嫌在平台匿名发表虚假身份评论以影响用户观点。事件引发社区强烈反响,Reddit 官方予以谴责并封禁相关账户,计划推出身份验证工具以保障真实交流及用户隐私

1 个月前

Momos AI平台推动北美1350家餐厅创新升级,引领餐饮业变革

Momos公司的人工智能客户助理平台已在北美1350家火屋潜水艇餐厅上线,提供全面的客户管理解决方案,助力餐厅数字化转型。火屋潜水艇通过与Momos的合作,实现了品牌形象的提升和顾客体验的优化,展示了科技与服务结合的价值

1 个月前

Recraft 力压群雄,3000 万美元 B 轮融资助力图像生成技术挑战行业领先企业

Recraft 完成由 Accel 领投的3000万美元B轮融资,年化经常性收入突破500万美元,用户量达400万。其图像生成模型“red_panda”在行业基准测试中领先,彰显公司在AI图像生成领域的核心竞争力。公司创始人多罗古什凭借深厚的技术背景和市场洞察,推动Recraft在激烈竞争中脱颖而出

1 个月前

阿里通义Qwen3语言模型震撼发布,开源实力迈向新高度

通义宣布开源大型语言模型Qwen3,其旗舰模型Qwen3-235B-A22B在基准测试中表现出色,超越多个顶级模型,支持119种语言,满足全球需求。Qwen3系列模型的开源将推动研究与发展,提供多样化的应用场景和部署选项

1 个月前

探秘月之暗面:Kimi长思考模型API震撼上线

月之暗面科技有限公司发布kimi-thinking-preview,一款具有深度推理和多模态支持的长思考模型API,旨在解决复杂问题并提供透明的推理过程。该模型API支持流式输出和多轮对话,但目前存在一定限制,公司已提供使用最佳实践。此发布标志着公司在AI推理领域的显著进展

1 个月前

IBM CEO 重磅布局:全面挺进人工智能领域,大幅增强美国市场投资

IBM 首席执行官阿尔温德・克里希纳宣布,公司将通过推出整合不同 AI 代理的软件工具以增强市场竞争力,并计划在未来五年内向美国市场投资1500亿美元,同时致力于在美国制造量子计算机,以推动业务增长和技术布局

1 个月前

全新升级!LLaMA-Omni 2 实时口语聊天模型,AI聊天体验全面飞跃

本文介绍了LLaMA-Omni2系列端到端的语音语言模型,旨在实现高质量的实时语音交互。该模型结合了Whisper编码器和CosyVoice2模型,通过分阶段训练策略,显著提升了语音到语音的交互性能。实验结果表明,LLaMA-Omni2在口语问答和语音指令跟随任务中优于基线系统,展现了其在实时语音交互领域的巨大潜力。尽管存在一定局限性,但该模型为未来语音交互技术的发展提供了新的方向

1 个月前

SD?ACE-Step革命性音乐生成模型问世,20秒内快速创作4分钟完整曲目

ACE-Step,一款由ACE Studio与StepFun共同开发的AI音乐生成模型,近日推出,以其20秒内生成4分钟完整音乐作品的惊人速度和多语言支持功能受到关注。该模型具备从歌词到完整歌曲的一键生成能力,支持多样化音乐风格,并在GitHub上开源,为音乐创作提供高效便捷的解决方案,预示着AI音乐创作领域的新趋势

1 个月前

腾讯元宝全新升级:对话分组功能全平台同步,免费不限次数畅享

腾讯元宝推出「对话分组」功能,旨在优化用户对话管理,通过创建分类文件夹,提升用户体验。该功能支持对话分类、历史对话迁移及个性化设置,使用户能高效定位和管理聊天内容。目前已全面免费上线

1 个月前

商汤科技强强联手中国移动香港及香港中文大学法学院,共拓视觉AI与大模型领域新合作

商汤科技与香港移动及中文大学法学院签署备忘录,启动视觉人工智能与大数据技术合作,旨在推动科技创新、扩展市场应用,并确保符合法律伦理标准,促进香港科技与法治环境协同发展

1 个月前

马斯克坚持诉讼OpenAI,新战略成为关注核心

美国亿万富翁埃隆·马斯克因不满 OpenAI 转变为营利性公司的计划,持续提起诉讼。尽管 OpenAI 已宣布调整运营模式,马斯克仍坚持诉讼,反映其对人工智能安全性和可控性的关切。此法律争斗将影响人工智能领域的未来研究和应用,预计2026年3月进入陪审团审判阶段

1 个月前

Perplexity AI 发布革命性 Comet 浏览器,剑指 Chrome 霸主之位

Perplexity AI 即将推出其AI驱动的Comet浏览器,旨在挑战Google Chrome市场地位,通过AI技术提升用户搜索效率,并配备隐私设置以保障用户数据安全

1 个月前

惊曝:非学生用户也可免费畅享谷歌顶级AI全家桶,速领白嫖攻略

谷歌旗下AI服务Gemini Advanced出现订阅系统漏洞,允许用户免费获取价值300美元/年的学生特权套餐,包含高级AI功能及2TB云存储,但仅限美国地区18岁以上学生,并需在规定时间内完成身份验证。该漏洞存在潜在风险,需谨慎使用

1 个月前

马斯克坚持对OpenAI提起诉讼,纠纷持续发酵中

美国亿万富翁埃隆·马斯克持续对人工智能公司OpenAI发起诉讼,指出其商业化进程与初衷相悖。尽管OpenAI调整运营模式,但马斯克不满依旧,双方争议持续升级。诉讼定于2026年3月审理,案件备受业界关注

1 个月前

芝浦工大研发Vote-based新框架,显著增强手持物体姿态估计准确性

芝浦工业大学研究团队开发了一种基于Vote机制的多模态融合框架,显著提升了手持物体姿态估计的准确性,尤其在手部遮挡情况下。该框架整合RGB和深度图像数据,通过深度学习技术优化姿态估计,实现了13.9%的精度提升,并展现出良好的实用性和部署潜力,为AR/VR技术的应用提供了新的可能性

1 个月前

南天信息携手新华三打造行业领先大型模型一体机,引领智能计算新篇章

南天信息子公司海捷科技与新华三集团达成合作,推出基于LinSeer Cube的大模型一体机,旨在提升企业数字化转型和智能化水平,满足高效便捷的解决方案需求,加速行业智能化应用发展

1 个月前

谷歌新推儿童AI聊天机器人,安全问题引关注

谷歌即将推出面向13岁以下儿童的Gemini AI聊天机器人,由家长管理。此举旨在扩大年轻用户市场,但引起对儿童安全的担忧。专家和非营利组织警告,社交AI可能对未成年人构成风险,呼吁加强监管

1 个月前

Claude移动应用全新升级:语音模式震撼上线,多样声音任你选择

Anthropic的Claude移动应用将推出语音模式升级,支持推按式对话、多种声音选项,并具备网页搜索和文件上传功能,提升用户互动体验和任务处理能力

1 个月前

Anysphere(Cursor母公司)完成9亿美元巨额融资,估值猛增达90亿美元

Anysphere宣布完成9亿美元融资,估值达90亿美元,由Thrive Capital领投,Andreessen Horowitz和Accel参与。Cursor作为其旗下AI驱动的代码编辑器,凭借强大的编程辅助功能,已获得市场广泛认可。本轮融资将用于加速技术研发和全球市场拓展,巩固其在AI编程工具领域的领先地位

1 个月前

AI Agent 部署即将迎来爆炸式增长,未来两年涨幅惊人327

Salesforce 全球调研显示,全球人力资源高管计划在未来两年内大幅扩展人工智能(AI)代理的部署,以提升生产力。77%的受访者认为AI代理将成为劳动力的重要组成部分,预计到2027年部署增长327%,生产力提升30%。企业需重视员工再培训及软技能提升,以适应AI时代的职场变化

1 个月前

KREA AI联合ChatGPT创新推出视觉提示编辑,解锁图像创作全新境界

KREA AI最新功能更新引入OpenAI GPT图像API,实现直观的视觉提示驱动的图像编辑,显著提升创作灵活性及互动性,展现了生成式AI技术在图像领域的应用潜力,并拓宽了创意工具的边界

1 个月前

Excel MCP Server全新上线,支持Claude等多客户端直接编辑Excel文件

近日,开源工具Excel MCP Server受到关注,其基于模型上下文协议(MCP)开发,允许用户通过AI助手操作Excel文件而无需安装Excel软件。该工具具备创建、读取、修改表格数据等高级功能,支持Cursor和Claude等AI客户端,具有广泛的应用前景。其开源属性促进了社区活跃参与,预示着AI与传统办公软件融合的新趋势,可能重塑数据处理效率

1 个月前

DeepMind新研究:AI故意选择迂回路径以探索最优解

本研究探讨了大型语言模型(LLMs)在决策制定中的表现,发现其在实际决策时存在“知行合一”的差距,表现为探索不足、贪婪和频率偏差等行为。研究通过强化学习微调(RLFT)方法对LLMs进行训练,有效提升了其决策能力,减少了知行差距。同时,论文强调了思维链(CoT)在决策过程中的重要性,并提出了额外的探索机制以辅助训练。结果表明,模仿专家行为也是一种提高AI决策能力的方法。尽管如此,AI在成为真正的“

1 个月前

Suno v4.5全新升级:付费用户专享,音乐生成时长增至8分钟

Suno人工智能音乐生成平台最新模型v4.5正式上线,显著提升音质、风格多样性和用户体验,特别针对Pro和Premier付费用户开放。v4.5版本在音乐风格智能混搭、声线表现、音效层次及提示词响应精度等方面实现重大突破,增强创作自由度。付费用户享有更高创作配额、商业使用权及优先功能访问等特权。Suno的快速发展和行业领先地位受到关注,同时也面临版权诉讼的挑战

1 个月前

2026年Waymo拟扩充2000辆智能出租车队,引领未来出行革命

Waymo 宣布扩展其机器人出租车车队,计划到2026年增加2000辆捷豹 I-Pace 车辆,使总规模达到3500辆。目前,1500辆捷豹 I-Pace 已在旧金山等四个主要城市运营。Waymo 在亚利桑那州设厂组装车辆,并目标每年生产数万辆新车,以支持其自动驾驶技术的市场推广和服务扩展

1 个月前

ChatGPT 用户访问创新高:4月突破47.86亿次,首超X平台

OpenAI的ChatGPT全球访问量突破47.86亿次,首次超越社交媒体平台X的40.28亿次,显示生成式AI工具的普及度迅速上升。Similarweb报告指出,ChatGPT流量增长显著,且具有“工作性”特征,工作日访问量显著高于周末。技术迭代和功能增强是流量增长的核心驱动力。ChatGPT的全球化用户基础持续扩大,尤其在美国、印度等地区受欢迎。其作为生产力工具的定位,使其在功能性AI领域的竞

1 个月前

Visa 新智能商务平台:AI 助力,安全购物新体验

Visa推出“Visa智能商务”平台,利用人工智能助手代表用户执行购物流程,实现安全支付。该平台通过与多家AI公司合作,旨在将支付功能集成至AI系统,填补AI商务领域的空白。用户可设置消费参数,保持交易控制,同时Visa确保交易安全并提供传统信用卡保护。此举旨在推动AI在商务应用中的发展,并增强消费者信任

1 个月前

11x迎来高层变动:创始人卸任CEO,Prabhav Jain崭新篇章开启

11x创始人Hasan Sukkar宣布辞去CEO职务,由现任CTO Prabhav Jain接任。Sukkar将担任非执行董事长,继续参与公司战略和业务拓展。11x已筹集超7000万美元,曾面临客户和产品挑战

1 个月前

谷歌Gemini聊天机器人焕新亮相:新增多图上传与图像编辑功能

谷歌近日对 Gemini 聊天机器人进行重要更新,引入多图上传和 AI 图像编辑功能,目前正分阶段向用户推出。此次更新旨在提升用户体验,增强功能性和创意表达,预计将吸引更多用户使用。同时,用户需遵守相关使用条款,确保合规性

1 个月前

阿联酋领先全球:幼儿园人工智能教育普及,世界教育新风向标

阿联酋宣布将人工智能纳入幼儿园至高中必修课程,2025-2026学年正式实施。该计划旨在培养年轻一代的AI技能,巩固阿联酋在区域内的科技领导地位,并与国家AI战略和经济发展愿景相一致。课程涵盖七个关键学习领域,由经过培训的教师授课,旨在提升学生的AI素养和经济竞争力

1 个月前

礼貌用语的力量:研究证实‘请’与‘谢谢’可提高AI模型回应品质

研究表明,礼貌用语如“请”和“谢谢”在与人工智能交流时,可能提升模型响应的质量。谷歌 DeepMind 高级研究员指出,友好且清晰的措辞对模型输出有积极影响,尽管效果因模型和情境而异,这暗示了人类交流方式对人工智能性能的潜在影响

1 个月前

英伟达升级开源力作:Parakeet-TDT-0.6B-V2自动语音识别模型,转录精度大幅提升

英伟达推出Parakeet-TDT-0.6B-V2自动语音识别模型,具备高转录效率和优异性能,支持多样化应用场景,并通过Hugging Face平台开源。该模型以FastConformer编码器和TDT解码器架构为基础,在开放ASR排行榜上表现突出,接近商业转录工具水平。其训练基于大规模语音数据集,具备良好的泛化能力和稳定性,兼容多种GPU硬件,无需个人数据,符合负责任AI开发标准

1 个月前

筑牢网络安全防线!Cisco联合Meta发布新一代Foundation-sec-8B大型语言模型

在RSAC2025大会上,Cisco与Meta合作推出了针对网络安全优化的开源大型语言模型Foundation-sec-8B。该模型专门为网络安全任务设计,能加速SOC工作流程,提供精准威胁防御,并灵活适应企业需求。同时,Meta展示了增强安全性的AI Defenders工具包,包括Llama Guard4和LlamaFirewall。ProjectDiscovery的Nuclei工具获得创新奖项

1 个月前

Visa 重磅押注:AI 代理将智能管控您的信用卡消费未来

Visa 推出“智能商务”计划,利用人工智能代理根据用户预算和偏好自主购物,并与多家科技公司合作,包括OpenAI、微软等。计划旨在为新时代商业树立标准,通过支持人工智能的信用卡提升购物体验和安全性。尽管存在隐私和安全问题,Visa 和其竞争对手万事达卡均致力于发展人工智能代理,以实现更智能的购物建议和自主购买

1 个月前

Freepik 推出版权安全型开放 AI 图像模型 'F Lite

西班牙数字图形公司 Freepik 推出基于其自有商业授权图像库训练的文本到图像生成模型“F Lite”,旨在提供合法安全的替代方案,并与人工智能初创公司 Fal.ai 合作开发。F Lite 是首个依赖“工作安全”内容训练的大型公开模型,并在 GitHub 上开源,适用于开发者进一步开发。Freepik 此举标志着其在人工智能工具领域的拓展,同时响应了行业对版权安全训练数据集的需求

1 个月前

MCP-SuperAssistant浏览器插件全新上线:深度挖掘AI平台强大潜能

MCP-SuperAssistant,一款基于Anthropic模型上下文协议的Chrome浏览器插件,已上线并集成至主流AI平台,显著提升AI交互能力。该开源插件支持自动检测与一键执行功能,实现高效工具调用和数据连接。易于安装且兼容多平台,MCP-SuperAssistant预示着AI生态系统的未来发展,有望成为AI工具集成的关键桥梁

1 个月前

OpenAI掷30亿美元巨资收购AI编程助手Windsurf

OpenAI 宣布将以约30亿美元收购人工智能编码助手公司Windsurf,此举标志着其迄今为止最大的收购案。该交易预计将增强OpenAI在AI领域的竞争力,同时引发行业对竞争格局的关注。此外,OpenAI近期决定缩减转型为营利性公司的计划,面临法律挑战和批评

1 个月前

Anthropic发布AI助力的“科学加速器”计划,助科研工作者突破创新难关

Anthropic推出“AI for Science”计划,免费提供API积分支持生命科学研究,旨在通过人工智能提升科研效率,加速科学发现,助力解决重大挑战。该计划针对生物学等领域的高影响力项目,依据研究贡献及AI应用潜力选拔申请项目

1 个月前

Cursor 代码生成器走红,Anysphere 年营收突破2亿美元

旧金山人工智能初创公司Anysphere完成9亿美元融资,估值达90亿美元,获得Thrive Capital等知名投资机构支持。公司核心产品Cursor能够自动生成代码,提高开发效率,客户包括Stripe、Spotify和OpenAI。尽管面临OpenAI收购竞争对手的潜在挑战,Anysphere业务增长迅速,年收入已超2亿美元

1 个月前

谷歌承认:退出网站用户数据仍被用于AI训练

在联邦反垄断审判中,谷歌承认即使出版商选择退出,仍会利用搜索引擎收集的数据进行人工智能训练,引发对该公司数据处理和垄断行为的关注。谷歌内部文件显示,已收集1600亿个文本单元用于AI训练,且出版商无法有效阻止其内容被用于AI目的。此外,谷歌的市场垄断地位及其对网络内容的管理方式正面临监管机构的严格审查

1 个月前

OpenAI 转向非营利模式,结束营利实体掌控策略

OpenAI 宣布放弃营利性实体控制机制,回归非营利董事会主导的管理结构,将其营利性业务部门转变为公益公司。此调整旨在确保组织在非营利框架下运作,同时扩大资金池以支持公益事业,并保持商业灵活性。新治理模式强调社会效益透明度,应对商业与公益间的平衡挑战

1 个月前

国行iOS 18.6将启用AI功能,苹果AI技术预计携手阿里、百度共同提供

苹果计划在iOS18.6系统中首次在中国大陆启用AI功能,合作方为阿里巴巴和百度。由于政策限制,苹果AI将采用百度文心一言大模型,并引入阿里巴巴的审查机制以确保合规性。苹果CEO蒂姆·库克曾表示正与监管机构沟通,推动AI在更多市场落地。然而,国行版苹果AI的推出时间尚不确定

1 个月前

OpenAI 宣布转向非营利模式,全力推进AGI惠及全球

OpenAI 宣布重大组织结构调整,将营利部分转型为公共利益公司(PBC),强调服务全人类的宗旨,并保持非营利组织的监督与控制。此举旨在确保通用人工智能(AGI)为人类创造价值,同时重建公众信任,并通过清晰的治理方式促进技术的安全与有效使用

1 个月前

Anthropic 发布 AI for Science 计划,加速生命科学研究进展与发现

Anthropic公司推出AI for Science计划,旨在通过提供免费API积分助力科学研究,利用AI技术加速科学发现进程,并专注于生物学和生命科学领域的高影响力项目。该计划将评估研究人员的贡献及AI对研究的促进作用,由内部和外部专家共同评审,以推动科学进步和解决紧迫挑战

1 个月前

Claude AI升级在即:网页版新增MCP定制链接功能

Anthropic计划升级其Claude网页应用,通过引入Model Context Protocol(MCP)增强定制集成能力,突破谷歌服务限制,简化AI与外部工具的连接,提升用户体验和工作效率

1 个月前

苹果公司联合Anthropic,共同升级打造新一代编程平台Xcode

苹果公司正与人工智能公司Anthropic合作,开发集成AI功能的新版Xcode编程工具,旨在提高编程效率。新版Xcode将采用Anthropic的Claude模型,目前已在苹果内部推广试用。苹果正积极布局AI领域,与多家科技公司建立合作,推动人工智能技术的应用与发展

1 个月前

马斯克力挺Grok语音模式全新上线,更名为X为新技术造势

Grok人工智能平台推出语音模式,为用户提供自然语言对话体验,支持个性化设置和学习优化功能。特斯拉和SpaceX首席执行官马斯克疑似为该更新进行宣传。Grok语音模式免费提供服务,同时为付费用户提供优先体验等特权,并提供多种个性化对话模式,包括18+模式。新增语音字幕功能受到用户好评

1 个月前

Midjourney 强势更新:全新 'Omni-Reference' 功能助力图像生成再升级

Midjourney推出全新“Omni-Reference”功能,为用户提供了精准的图像元素控制,支持多样化元素、多对象生成及灵活权重调整。该功能集成于V7模型,通过多模态融合技术提升图像质量与风格表现。Omni-Reference适用于艺术创作、游戏开发、广告设计等多个领域,并已开放于Web与Discord平台。社区反响积极,期待进一步优化与扩展功能。该技术被视为AI艺术创作领域的重要里程碑

1 个月前

Reddit升级搜索体验:AI助手助您轻松告别繁杂查找

Reddit 推出 “Reddit Answers” 功能,将人工智能整合进主搜索栏,旨在提升用户搜索效率,简化信息获取过程,预示着未来搜索习惯可能发生变化

1 个月前

美国版权局迎来里程碑:千件AI增强作品注册,艺术创作新规引关注

美国版权局已成功注册超1000件通过人工智能增强的作品,反映了版权法在应对新兴科技方面的进展。版权局助理总法律顾问强调,仅当人类创作为核心且AI辅助时,作品方可获得版权保护。此规定引发关于原创性和艺术价值的广泛讨论,同时确认AI在某些技术应用中的版权注册资格,预示着艺术创作与AI结合的法制框架将不断演进

1 个月前

AI模型竞赛背后真相:Llama4发布前秘密测试27版,独选最优成绩夺冠

排行榜幻觉》论文对Chatbot Arena排行榜的公正性和可靠性提出质疑,指出数据访问不平等、模型私下测试等问题导致排行榜膨胀及误导用户。研究建议改进排行榜机制,以增强公正性和透明度,AI社区正探索使用多个评估平台以更全面地评估模型能力

1 个月前

微软Azure接入马斯克Grok AI,谷歌同步探索AI搜索革新

微软Azure平台将托管Musk的Grok AI模型,谷歌启动AI搜索模式测试,多邻国推出148门AI生成语言课程,标志着AI技术在云计算、搜索引擎和语言学习领域的深入应用与创新发展

1 个月前
Sitemap.xml
© 2025 Juhe.ai
西安指尖漫步科技有限公司