本研究摘要:华中科技大学、字节跳动及香港大学联合团队开发了一种名为Liquid的新型多模态生成框架,通过采用VQGAN作为图像分词器,实现了图像与文本的统一处理,无需依赖外部视觉模块。实验表明,Liquid在多模态理解、图像生成及文本任务中表现出色,揭示了多模态能力与模型规模的正向关联,为通用多模态智能架构设计提供了新方向
xAI宣布其AI模型Grok-3在Chatbot Arena排行榜上领先,以微弱优势超越GPT4.5-Preview,在多个领域表现出色。这一成就体现了xAI在AI领域的进展,符合创始人马斯克对强大且符合人类价值观AI的追求。尽管Grok-3标记为“preview”,表明可能仍在测试阶段,但其性能已得到显著认可
人工智能初创公司Anthropic完成35亿美元E轮融资,估值达到615亿美元,由光速创投领投,多家知名投资机构参与。此轮融资凸显了市场对Anthropic在AI领域发展潜力的信心,资金将用于加速AI系统研发和全球市场扩张,进一步加剧AI行业的竞争格局
国家网络安全通报中心针对开源跨平台大模型工具Ollama发布安全预警,指出其默认配置存在严重安全漏洞,可能导致未授权访问和数据泄露等风险。清华大学网络空间测绘联合研究中心的分析确认了漏洞的广泛影响,强调了加强用户安全意识与防范措施的重要性。专家建议用户进行全面排查,并及时报告网络攻击迹象,以保障网络安全
百川智能宣布对To B业务进行重大调整,裁撤金融行业B端组,并将PE团队调整至产研组,以集中资源优化金融业务并加速AI医疗技术发展。公司AI医疗项目已取得显著成果,与北京儿童医院合作研发的AI儿科医生投入会诊,标志着全球首个正式应用的AI医生诞生。此举显示百川智能正向聚焦AI医疗的战略转型
Opera 宣布推出 AI 代理“浏览器助手”,实现浏览器功能重大升级,通过自然语言指令提升用户工作效率,并在浏览器内原生运行以保护隐私和提高响应速度
Google recently updated its Gemini app on iOS and iPadOS platforms, introducing six new lock screen widgets designed to enhance user experience by providing quick access to AI assistant features. This
出版商正遭遇人工智能聊天机器人带来的流量危机,数据显示,AI聊天机器人的流量吸收导致出版商网站流量减少了96%。此现象严重威胁出版商广告收入,并可能重塑数字内容行业格局。尽管AI公司承诺合作增加媒体流量,实际情况却相反,引发出版商对互联网生态的担忧
全国人大代表雷军于两会期间提出建议,强调人工智能终端产业高质量发展的重要性,并针对AI换脸拟声技术的违法侵权问题提出治理措施。雷军建议完善人工智能终端标准体系,加强产业协作,提供政策与资金支持,同时呼吁立法进程加速、行业自律及普法宣传,以保障技术进步与公民权益的平衡发展
全国人大代表、小米集团董事长雷军在全国两会上提出五项建议,涉及自动驾驶量产、智能网联新能源汽车产业生态发展、人工智能终端产业高质量发展、新能源汽车号牌设计优化及“AI换脸拟声”违法侵权治理。雷军建议完善人工智能终端标准体系,推动国际国内标准衔接,争取在2027年初步建成,2030年形成全球领先的标准体系
在最新进行的“Elimination Game”基准测试中,AI模型GPT-4.5在“狼人杀”游戏中表现卓越,以62.6%的胜率领先其他AI对手,展现出高级的社交推理和策略能力。测试结果表明,AI在社交智能领域已达到显著水平,预示着未来AI在社交互动中的潜力将不断扩展
Podcastle推出AI文本转语音模型Asyncflow v1.0,提供450种语音,并开放API接口。该模型研发受益于大型语言模型技术进步及1350万美元A轮融资。服务价格具有竞争力,每500分钟约40美元,且语音克隆功能升级,显著提高用户体验
三星宣布Galaxy S25系列在中国市场整合DeepSeek-R1大模型,增强AI功能,提升多模态感知和跨应用执行能力,优化用户沟通体验,标志着三星在AI手机领域的重要进展
在移动世界大会上,亚马逊人工智能通用技术副总裁维沙尔·沙尔玛强调,人工智能已全面融入亚马逊各项业务,包括云计算、机器人技术及消费者产品。亚马逊推出“Bedrock”服务,助力企业灵活应用多种基础模型,并持续投资大型AI计算集群,展现其对计算能力的重视。沙尔玛表示,亚马逊对开放源代码模型的出现持欢迎态度,并坚信客户的选择
火山引擎正式开源其大模型应用,并推出“大模型应用实验室”平台,以促进AI技术生态建设。此举旨在加速开发社区创新,涵盖多种AI工具,获得X平台用户的热烈响应,标志着火山引擎在AI领域的战略转型,有望推动大模型应用落地及行业协作
南洋理工大学研究团队开发的“GaussianCity”技术,实现了3D城市模型生成速度的显著提升(高达60倍),并突破了规模限制,支持无边界的3D城市生成。该技术已被CVPR 2025接收,标志着虚拟现实、自动驾驶和数字孪生领域的重要进展。GaussianCity通过BEV-Point表示方法和空间感知解码器,实现了高效、逼真的城市模型生成,并已全面开源。该技术为多个行业提供了高质量、大规模城市环
全国政协委员、360集团创始人周鸿祎就AI安全议题提出观点,强调应正确看待AI安全,避免夸大或忽视。他指出,不应通过渲染AI不安全来支持垄断,而应抓住AI工业革命机遇,提升生产力。周鸿祎认为AI“幻觉”问题应视为技术挑战,而非单纯安全隐患,呼吁理性对待并寻求针对性解决方案
摘要:DeepBeepMeep团队推出Wan2.1GP模型,为低端GPU用户提供了性能卓越的视频生成解决方案。该模型在基准测试中超越现有开源及商业模型,兼容性强,显存需求低,并支持多任务及中英文文本生成,为视频生成领域带来重要进展
智谱华章科技有限公司发布开源文生图模型CogView4,实现中文生成,成为DPG-Bench基准测试SOTA,遵循Apache2.0协议。模型具有卓越的双语处理和图像生成能力,采用先进技术提升创作效率和图像质量,并计划扩展生态支持
智谱AI开源中文文生图模型CogView4,实现中文图片生成技术突破,具备卓越的中文理解力和生成质量,支持无限制图片尺寸与长文本描述,权威测试中排名第一。模型提供深度定制可能,并计划开放配套工具,为用户提供全面的高质量图像生成解决方案
智谱AI推出开源文生图模型CogView4,具备6亿参数,全面支持中文输入及生成,成为首个在图像中生成汉字的开源模型,显著提升中文内容创作效率。模型采用GLM-4文本编码器,实现中英双语输入,优化动态文本长度处理,并能生成任意分辨率图像,通过多阶段训练流程,提高生成质量和多样性
字节跳动豆包大模型团队与M-A-P开源社区联合发布SuperGPQA,一种包含285个研究生级学科、26,529道问题的知识推理基准测试,填补了长尾学科评估空白。该数据集通过专家-LLM协同机制构建,揭示开源与闭源模型性能差距,指出大语言模型在多领域知识推理上的提升空间
OpenAI的GPT-4.5模型在发布后短时间内成为全任务分类第一名,但随后被马斯克的xAI Grok-3模型反超。两模型票数接近,仅在特定任务上存在差异。尽管GPT-4.5面临初始负面评价,用户对其情商的认可度逐渐上升。人工智能领域竞争激烈,未来智能之战的结果尚不明朗
Spotify 推出创新性 AI 音乐创作工具“Music Pro”,旨在将用户从被动听众转变为主动创作者,增强用户体验并探索新的收入渠道。该平台已通过 AI 技术优化推荐系统,并计划进一步拓展 AI 功能,预示流媒体行业即将迎来新变革
耶鲁大学、达特茅斯学院及剑桥大学研究人员共同开发出一款名为MindLLM的AI模型,能够将功能性磁共振成像(fMRI)信号解码转化为可读文本,实现了显著的突破。该模型采用大脑指令调整(BIT)技术,大幅提升了解码精度和泛用性,为失语症等语言障碍患者提供了新的沟通途径,并为人机交互领域带来革命性变革的可能性
KLING AI 官方宣布其 Android 应用程序全面上线,标志着该平台核心功能如 Frames 和 Elements 现可通过移动设备实现便捷访问,进一步拓宽用户创意体验。此举旨在实现“让创意无处不在”的愿景
可灵AI官方发布安卓应用,集成核心功能如AI视频及图像生成,支持1080P高清视频制作和多样化图像创作,简化用户创作流程
自变量机器人完成Pre-A++轮融资,由光速光合与君联资本领投,资金将用于下一代具身智能通用大模型研发。该公司致力于推动通用机器人技术发展,其创始人具备深厚的学术背景和行业经验。此轮融资将助力自变量机器人在具身智能领域深化探索,增强中国在全球机器人市场的竞争力
Stability AI与Arm合作,推出可在移动设备上离线运行的Stable Audio Open模型,显著提升音频生成效率,将生成时间缩短至8秒,效率提高30倍。此技术兼容多数搭载Arm CPU的智能手机,并计划扩展至其他媒体创作领域
Viam 成功完成3000万美元C轮融资,总融资额累计至1.17亿美元,由联合广场创投领投,旨在推动其在数据、人工智能和自动化领域的发展。公司持续扩大客户基础,覆盖多个行业,并与知名企业合作,强化市场地位。Neurone投资集团的支持将助力Viam在欧洲市场,特别是意大利的扩张
飞猪将于3月5日推出在线旅游行业首个融合多个大模型的AI产品——“AI行程助手”,集成DeepSeek-R1和阿里云通义千问模型,提供秒级个性化旅行方案。该产品引发X平台热议,被视为AI技术在旅游行业落地的里程碑,有望推动行业智能化、个性化转型
在最新一轮的AI游戏挑战中,Anthropic的Claude3.7模型在《超级马力欧兄弟》模拟器中表现卓越,荣获“最强AI马力欧”称号,领先于同门Claude3.5模型。OpenAI的GPT-4o和谷歌的Gemini1.5Pro表现不佳,反映出在实时游戏环境中,反应速度是关键因素。此竞赛展示了AI技术的快速进步,但其真实应用能力仍需实战检验
通用汽车任命巴拉克・图罗夫斯基为首席人工智能官,强化其在AI领域的战略布局,致力于将AI技术应用于电动汽车、内燃机及自动驾驶等关键业务,以推动公司智能化发展。图罗夫斯基将负责整合AI软件功能,提升产品及业务智能化水平
全国人大代表雷军在人大会议上强调制造业的重要性,并展望小米未来发展方向。他表示小米将坚持科技创新,加大研发投入,特别是在AI领域的应用,以推动中国式现代化。小米计划未来五年投入1050亿元研发资金,助力产品高端化及全球化战略
OpenAI 宣布与全球15所顶尖大学结成 AI 教育联盟,推出 NextGenAI,并提供5000万美元资金及最新模型 API,旨在加速人工智能在教育领域的融合与创新,预示着高等教育模式即将迎来颠覆性变革
OpenAI 宣布成立 NextGenAI 联盟,提供5000万美元资助15所顶尖大学开展人工智能研究,旨在推动AI技术创新与应对研究挑战。此举支持学术界发展,尽管存在对OpenAI中立性的担忧,NextGenAI 联盟仍被视为推动AI进步的重要举措
vivo 公司进行组织架构调整,成立新 AI 领域部门,并任命张飞为总经理。公司调整 AI 大模型战略,重心转向端侧,暂停资金投入和商业化考核。同时,推出 DeepSeek-R1 满血版,提升 AI 助手智能化水平,以增强用户体验,推动未来发展
罗永浩最新创业方向聚焦AIOS领域,挖角小米资深人士汪文俊加盟,依托其AR产品公司The Red Line拓展业务。罗永浩计划先发展AIOS,后推出AI手机,当前研发重点为AI助手J1Assistant。公司已获约5000万美元天使轮融资,现正寻求第二轮融资以推进AIOS研发及AI手机规划
亚马逊计划于今年6月推出集成高级推理能力的Nova人工智能模型,作为其去年发布的生成式AI产品线的一部分。该模型采用“混合推理”方法,旨在提升价格效率,并在性能上排名行业前五,以在激烈的市场竞争中占据优势。亚马逊的此番动作展现了其在人工智能领域的技术雄心,并进一步加强了与主要竞争对手的竞争格局
Nvidia 宣布其旗舰显卡 GeForce RTX 5070 Founders Edition 将推迟至三月份上市,而第三方版本将于3月5日发布。性能评测显示 RTX 5070 实际表现与预期有差距,市场反馈参差不齐,为产品发布增添不确定性
YouTube 发布警告,指出利用CEO尼尔・莫汉的AI伪造视频实施的网络钓鱼诈骗正针对内容创作者。该诈骗通过私密视频传播,声称调整盈利政策以窃取账号信息。YouTube 提醒用户警惕此类诈骗,并在官方网站举报,以确保账号安全
硅基流动宣布将于2025年3月6日下线未经审查的国外模型,包括部分生图、对话和语音模型,以优化资源配置及服务合规性。受影响的用户需在截止日期前完成模型迁移
亚马逊AWS成立专责智能代理AI团队,旨在自动化用户生活任务,AWS首席执行官视其为下一个潜在数十亿美元业务。该团队由资深AWS高管领导,标志着亚马逊在智能助手领域的深入布局,并计划开发企业级智能代理,与行业巨头竞争
DiffRhythm,全球首个端到端音乐生成模型,采用扩散变换器架构,实现了自动生成完整歌曲,包括人声与伴奏,仅需10秒。此技术显著降低音乐创作门槛,开启AI音乐创作新纪元,预示着音乐创作领域的重大变革
Bonobos创始人安迪·邓恩推出社交应用Pie,旨在促进现实生活中的人际连接,已获得1150万美元A轮融资,月活跃用户超13万。为解决用户社交难题,Pie收购了AI驱动的测验工具Sparked Connections,通过性格测试优化用户社交体验。随着AI在社交领域的应用日益普及,Pie旨在利用AI技术提高社交效率
微软研究人员开发新型图像生成技术ART,基于匿名区域布局和全局文本提示直接生成多层透明图像,引入逐层区域裁剪机制提升效率12倍以上,并采用高质量自编码器实现精确多层图像控制,助力交互式内容创作
爱诗科技宣布完成A5轮融资,由靖亚资本独家投资,光源资本担任独家财务顾问,累计融资额超4亿元,成为AI视频生成领域领军企业。该公司致力于AI视频生成技术,产品PixVerse用户量庞大,本轮融资将用于研发和人才引进,以增强竞争力
在B站直播的一场抠门对决中,UP主硬汉形象26挑战AI巨头DeepSeek,以5000元人民币预算规划长达十多天的日本之旅。结果显示,虽然AI生成的攻略具备主流适用性,但人类在极致预算与个性化需求上的应变能力,仍优于AI,凸显了人类在旅游规划中的独特价值
人工智能配音公司Dubformer获得360万美元种子轮融资,其情感转移技术引领AI配音行业创新,旨在提高配音质量和情感真实性,为视频本地化市场提供解决方案,并已在WMT2024比赛中获得领先地位
洛杉矶时报引入AI技术,为文章添加“声音”标签并生成“见解”分析,旨在提供多样化视角。然而,该做法引发工会成员担忧,认为未经编辑审核的AI分析可能损害媒体信任度。目前已出现AI分析错误,部分观点与文章内容不符,凸显编辑监督的重要性
美团CEO王兴在2月28日举行的首次高层沟通会上,提出未来十年将重点发展的三大方向:食杂零售、国际化及科技创新,旨在实现公司使命,拓展海外市场,并利用AI技术提升竞争力
联邦法官驳回了马斯克阻止OpenAI转型盈利公司的请求,缺乏充分证据。法院将加速审理OpenAI转型计划的合法性。马斯克曾提出收购OpenAI,但遭董事会拒绝。此裁决引发关于科技公司使命与盈利模式的广泛讨论
阿莱克・拉德福德,前 OpenAI 研究员兼 GPT 系列模型首席作者,在针对 OpenAI 的版权诉讼中被传唤。该诉讼由书籍作者群体发起,指控 OpenAI 在 AI 训练过程中侵犯版权。OpenAI 主张数据使用属合理使用,案件针对直接侵权索赔继续进行
xAI公司宣布其AI助手Grok的语音模式全面开放,包含11种语音交互模式及语音字幕功能,为用户带来个性化体验和英语学习新工具。该模式此前仅面向部分用户,现已成为所有用户的免费功能,受到X平台用户的广泛好评。尽管目前只支持英文,Grok语音模式在AI领域的创新表现引发期待
字节跳动正通过在抖音App内测试接入豆包AI能力,加速构建其AI生态布局。此举旨在提升产品AI功能,并引入更广泛的用户流量,同时与腾讯等互联网巨头在AI领域展开竞争,重塑数字交互体验
腾讯云智能数智人成功整合DeepSeek大模型,显著提升了用户交互体验,实现了更智能、灵活的应用场景覆盖,并增强了实时信息获取与处理能力,为各行业带来高效便捷的智能服务
斯坦福大学最新研究揭示,AI写作工具在多个领域应用激增,尤其在低学历地区表现显著。该研究分析了大量文本数据,发现AI在专业通信中占比已达四分之一。研究还指出,教育水平较低区域对AI写作工具的采用率超过高学历区域,且各州采用率存在显著差异,阿肯色州等地区领先。此现象可能引发社会各界对信息真实性的质疑
即梦平台成功接入DeepSeek智能提示词生成功能,助力用户轻松解决AI绘画中的提示词创作难题,提升绘画灵感与作品质量。此次合作有效解决了AI绘画爱好者的痛点,实现了从提示词生成到图像创作的无缝对接
本研究团队提出了一种名为Fast3R的多视角3D重建技术,采用基于Transformer的架构,实现了一次前向传播处理多达1500张图片的能力,显著提升了重建速度与效率。该技术优化了相机位姿估计和3D重建过程,减少了迭代对齐需求,并在大规模模型训练与推理中表现出良好的扩展性,为多视角3D重建领域提供了强有力的新解决方案
PyTorch核心开发者Horace He从Meta离职,加入初创公司Thinking Machines,引发业界对AI未来发展的热议。He在Meta的四年中为PyTorch作出显著贡献,PyTorch已成为机器学习领域的“通用语言”。此次离职被视为Meta的损失,同时也开启了He个人职业生涯及AI领域发展的新篇章
本研究概述了大型语言模型在生物医学研究中的应用挑战,并介绍了海德堡大学与EMBL-EBI合作开发的BioChatter框架。该框架旨在简化LLMs的使用,通过提供与生物信息学工具的无缝集成和直观API接口,增强研究人员对复杂数据集的分析能力。实验结果显示,BioChatter在生成正确查询方面表现出显著优势,未来将助力药物靶点识别和个性化医学研究
腾讯AI助手“腾讯元宝”因用户协议中关于知识产权的条款引发争议,条款涉及用户创作内容的版权问题。腾讯随后更新协议并增加数据管理功能,强调用户内容版权归属不变,同时回应公众关注,展现了用户权益与企业发展之间的平衡挑战
Mind Mapper 应用程序利用先进技术将用户思维转化为互动式思维导图,支持从多种来源快速生成导图,并提供便捷的分享功能,以优化思维整理和知识传播效率
在当前人工智能技术快速发展背景下,情侣们开始采用ChatGPT作为解决争吵的中立工具。此趋势反映了对传统心理治疗费用的高昂与AI辅助沟通的需求。尽管AI提供了一定帮助,专家提醒其建议的可靠性存疑,且需注意个人数据隐私保护。关键信息包括:ChatGPT作为关系调解者的兴起,AI辅助下的自我反思,以及对AI建议谨慎态度的强调
OpenAI前关键研究员亚历克・拉德福德因涉及版权诉讼案被传唤,该案涉及OpenAI的GPT技术及其产品ChatGPT。原告指控OpenAI在训练AI模型时侵犯版权。尽管部分诉讼请求被驳回,侵权指控仍在进行中。拉德福德并非唯一被卷入的知名人士,其他前员工也面临类似要求
Cursor,一家AI驱动的编码平台初创公司,在21个月内实现1亿美元年度经常性收入,创SaaS公司最快增长纪录。由麻省理工学院学生创办,致力于打造AI原生的集成开发环境,提供卓越用户体验。Cursor在激烈市场竞争中持续创新,面对来自GitHub Copilot等竞争者的挑战,但保持增长势头,已完成多轮高额融资
上海交通大学发布人工智能教育应用规范,强调学生和教师在利用AI工具时需遵守学术诚信和自主学习原则,同时要求教师合理应用AI提升教学质量。规范明确了学生和教师的职责,包括标注引用AI工具、培养独立思考能力,以及制定AI使用细则,旨在构建健康的教育体系并防范技术风险
CoreWeave,一家数据中心公司,已完成对人工智能开发平台Weights & Biases的收购,交易金额约17亿美元。此次收购将增强CoreWeave为云服务和基础设施客户提供强大应用开发工作流的能力,加速AI发展计划,并助力企业获得竞争优势。Weights & Biases的工具已被1400多家机构广泛使用,此次整合预计将提升开发效率,巩固CoreWeave
Meta宣布在英国扩展面部识别工具测试,以打击诈骗并协助用户找回被盗账户,得到监管机构批准。该工具包括名人诱饵保护及视频自拍验证功能,用户可自愿选择。Meta同时积极投资人工智能并应对相关法律挑战,包括支付14亿美元解决面部识别诉讼
瑞典EcoDataCenter(EDC)成功融资4.78亿美元,以应对人工智能计算需求的增长,并开发更环保技术和新型数据中心。该融资由匿名机构投资者提供,是继AI计算巨头CoreWeave提交IPO申请后的重要事件。EDC致力于可持续共置数据中心建设,使用交叉层压木材和可再生能源,以满足计算需求同时推动行业环保变革
Quantexa,专注于反洗钱和欺诈检测的英国初创公司,完成1.75亿美元F轮融资,估值达到26亿美元。该轮融资由TVG牵头,老股东参与,总融资额近5.5亿美元。公司业务增长迅速,客户包括多家知名企业,许可证收入增长40%,员工人数近800人。Quantexa正利用其技术扩展AI服务市场,并与微软深化合作,致力于公共部门AI应用的发展
EcoDataCenter(EDC)宣布完成4.78亿美元融资,旨在开发绿色数据中心技术,以满足人工智能计算需求。该公司累计股权融资达9.1亿欧元,不考虑单独上市。同时,EDC与CoreWeave合作,共同推进欧洲计算能力建设
杭州宇树科技有限公司成立深圳全资子公司,拓展智能机器人业务,对外投资五家公司,积极布局市场,并计划在北京和上海增设分公司,强化市场竞争力
即梦AI推出“动作模仿”功能,通过先进技术支持用户生成动态视频,实现静态图片中人物动作与表情的精准模仿。该功能具备多种画幅支持,并严格审核内容以确保合规性,同时添加“AI生成”水印
Manus AI Agent,一款被定位为“通用人工智能代理”的产品,由Manus AI公司开发并于2025年3月5日亮相,迅速在社交平台引发热议。该产品在GAIA基准测试中取得SOTA成绩,技术性能超越OpenAI等竞品,具备强大的任务执行能力。Manus AI Agent以其简单易用性和广泛适用性受到关注,市场反响热烈,引发邀请码热潮,但其未来与大型模型公司的竞争关系仍受关注
Windsurf团队于2025年3月5日发布了AI驱动的IDE最新版本——Windsurf Wave4,引入了多项创新功能,包括交互式预览、Tab-to-Import、实时代码检查、建议操作等,旨在提升开发效率和用户体验。用户反馈积极,将Wave4视为Cursor的强劲竞争者。尽管存在稳定性问题,Wave4的发布标志着AI编程工具领域的重要进步,预示着编程未来的发展方向
科技界近期聚焦于全球首款通用Agent产品Manus,该产品已启动内测,具备独立思考及执行复杂任务的能力,显著优于传统AI助手。Manus在GAIA基准测试中创纪录,性能超越OpenAI产品,显示其技术领先地位。创业者肖弘领导下的Monica公司,凭借Manus的出色表现,在海外市场取得显著成功
Manus,一款革命性的AI智能体,突破传统AI的问答局限,实现自动执行任务并交付成果。具备数据分析、任务执行、决策支持等全面能力,Manus在GAIABenchmark中达到SOTA水平,预示着AI智能体新时代的来临,将引领工作效率的革命
OpenAI 即将推出具备高级专业知识处理能力的“博士级”AI智能体,月费可能高达2万美元,旨在满足学术研究和软件开发等领域的复杂任务需求,预计将引起广泛关注
阿里巴巴旗下Qwen团队推出开源大型语言模型QwQ-32B,采用强化学习技术,显著提升复杂问题解决性能。该模型以Apache2.0许可证开源,支持商业和研究用途,具备扩展上下文长度和智能代理能力,计划继续探索强化学习在推理模型中的应用潜力
Monica团队近日推出的通用AI智能代理工具“Manus”广受欢迎,以其任务分解、自主执行和上下文理解能力为特色,显著提升工作效率。Manus采用多智能体架构,易于上手,适合广泛用户群体,并通过邀请制提供体验。其官网已上线,展示了智能助手的功能和应用场景
Monica团队开发的通用AI代理产品Manus启动内测,以其自主执行复杂任务的能力成为市场焦点。产品在GAIA Benchmark中达到SOTA水平,性能超越竞品,引发用户热烈讨论和期待。内测邀请码的发放进一步加剧了社区的兴趣,Manus未来表现备受瞩目
谷歌于3月5日推出“AI模式”功能,旨在提升搜索体验的智能化与直观性,通过定制版Gemini2.0驱动,实现更复杂问题的详尽解答。此功能支持图片和语音输入,并整合历史搜索记录,目前已进入面向高级用户的测试阶段,预示着搜索方式的重大变革
苹果公司即将在iOS 18.4版本中引入AI生成应用评论摘要功能,旨在快速提炼用户评论关键信息。该功能预计首先在美国App Store上线,并可能存在被滥用的风险
OpenAI 计划推出定价高达每月2万美元的“博士级”AI代理,针对金融、医疗和制造等高端企业需求,提供三种服务类型。此定价基于为客户创造的经济价值,旨在补偿研发成本。该AI代理能自动完成复杂任务,标志着人工智能技术的重大进步。尽管价格昂贵,OpenAI 旨在吸引大型企业客户,推动AI代理市场的发展
3月6日,Monica.im团队推出新型AI代理“Manus”,以其自主完成复杂任务的能力在科技界引发广泛关注,被视为AI领域的重大突破。Manus能直接交付任务成果,模拟人类工作方式,提供个性化服务,并在多场景中提升任务处理效率,预示着人工智能发展的新趋势
阿里巴巴正式开源高性能AI模型通义千问QwQ-32B,实现数学运算、代码编写及通用AI能力显著提升,性能可比行业标杆。该模型降低使用门槛,支持普通显卡本地化部署,并以Apache2.0协议开放给全球开发者,预示AI技术普及风暴即将来临
全球人工智能追踪报告》显示,人工智能技术正深刻重塑全球市场,推动开发者工具领域强劲增长,同时对数字自由职业平台构成挑战。设计平台展现与AI的共生韧性,而传统教育科技面临AI替代品的冲击。小众AI挑战者异军突起,市场动态剧变,强调利用AI创造新价值的重要性
摘要:DeepSeek AI 推出轻量级数据处理框架 Smallpond,结合 DuckDB 和3FS 优势,旨在简化分布式数据处理流程并提升性能。兼容 Python3.8至3.12,支持灵活的数据分区,有效应对 TB 至 PB 级数据挑战,GraySort 基准测试证实其高吞吐量性能
摘要:2025年3月6日,一款名为“Image to Code”的AI应用在AI Studio平台曝光,由Gemini技术驱动,能够将图像转化为程序代码。该技术结合了图像处理与编程,展现了AI在视觉识别与代码生成领域的最新进展,尽管具体应用细节尚未公布,但已引发科技界广泛关注和讨论
阿里AI To C业务旗下AI应用通义已接入最新开源推理模型通义千问QwQ-32B,实现移动端与网页端体验。该模型性能卓越,效率高,且降低部署成本,支持消费级显卡本地部署。通义App和网页版将不断更新最新模型,优化智能体生态,提升用户效率。同时,通义App产品交互更新,增添实用功能,丰富智能体体验
OpenAI 正式推出其最新、最大的人工智能模型 GPT-4.5,逐步开放给 ChatGPT Plus 用户,显著提升对话能力,但在复杂推理方面存在局限。然而,高昂的使用成本引发了对广泛应用的疑虑
IBM 发布Granite3.2大型语言模型,强调其小巧、高效、实用的特点,具备多模态处理能力,显著提升文档处理和数据提取性能。该模型引入视觉语言模型和思维链功能,增强推理能力,同时小型化Granite Guardian安全模型并推出风险评估的可言语化信心功能,旨在提高企业AI解决方案的效率与成本效益
OpenAI 宣布对 macOS 平台的 ChatGPT “应用协作” 功能进行重大更新,引入三项新设置及新用户界面,旨在增强与桌面应用的整合能力,提高用户体验。更新包括自动应用配对、生成编辑建议以及界面优化,预示着 ChatGPT 将进一步简化开发者与 AI 工具的互动,提升工作效率
CMA 宣布终止对微软与 OpenAI 合作关系的合并调查,认定双方合作未违反《企业法》合并标准。监管机构指出,AI 行业快速发展,合作形态持续演变。微软调整协议,增强 OpenAI 独立性,同时 CMA 关注科技巨头与 AI 企业合作模式
摘要:社交平台X上发现,ChatGPT最新版本GPT-4o拒绝生成玫瑰花图像,引发网友关注和讨论。实验显示,GPT-4o对“玫瑰”一词有特殊反应,但能生成其他花卉图像。网友猜测可能与内容政策或隐晦暗示有关,并发现变通描述可生成图像。此现象引发对AI内容过滤机制和审查合理性的讨论。其他AI平台无此限制,凸显内容限制差异
字节跳动推出AI助手豆包新功能“深度思考”推理模式,通过展示逻辑链条,增强用户对AI的信任与透明度。该技术基于豆包1.5模型和深度推理模型,采用思维链概念,为用户带来更智能、人性化的交互体验,预示AI领域发展新趋势
Spark-TTS,一款基于大型语言模型(LLM)的文本转语音系统,以其零样本语音克隆和细粒度语音控制技术,标志着语音合成领域的重大进展。该系统简化了音频生成流程,支持跨语言生成,并以其高度自然和准确的语音质量,适用于研究和商业应用
Anthropic公司悄然从官方网站撤下了与拜登政府联合发布的AI安全自愿承诺,引发外界关注。此举被视为该公司在AI安全与可信赖人工智能立场的调整,尽管承诺在法律上无约束力,但在政治层面具有象征意义。同时,特朗普政府的人工智能政策与前任政府存在明显差异,影响行业风向。Anthropic对此回应,将继续致力于原承诺,但外界对其真实意图仍存猜测
抖音集团发布征询意向公告,招募注册资本不低于100万元的独立法人企业作为AI数据标注供应商,以满足业务增长需求,推动行业竞争和创新