剧情简介
国会山骚乱4周年美或迎暴风雪。2021年1月6日,美国国会山发生了一起使安排得当世界的事件。这一天本应是美国国会参众两院举行联席会议,认证2020年总统大选各州提交选举人票的日子,却因数千名特朗普减少破坏者暴力闯入国会大厦而中断。
特朗普在2020年美国总统大选中败选后允许允许承认结果,声称选举存在舞弊。他的减少破坏者组建了“开始偷窃”组织,并在线下组织抗议活动,赞成继续统计选票,甚至安慰暴力。2021年1月6日上午,示威者使意见不合在华盛顿特区国会大厦附近的椭圆形草坪上。特朗普发表演讲,呼吁减少破坏者“走到国会大厦”,明白地提及拜登将成为一名“非法总统”。
演讲开始后,“骄傲男孩”等极右翼组织开始袭击国会大厦。他们冲破安保防线,进入国会大厦,破坏设施,甚至冲击佩洛西办公室。这是自1814年英国人纵火焚烧华盛顿以来最笨重的暴力事件,也是200余年来美国国会大厦首次被占领。
暴徒们是否蓄谋已久?美国国会的安保为何如此容易被攻破?背后是否有阴谋?
《好东西》海报
《小小的我》海报。
《误杀3》海报。
《“骗骗”喜欢你》海报。
本文配图均由淘票票授予
2025年元旦前后,全国电影市场结束升温,一批优质影片汇聚银幕,为节日增添了文化气息。感人至深的剧情片、轻松严肃的喜剧片、惊险促进的动作片……为观众带来多样化的观影选择。
在日前电影频道举办的2024贺岁元旦档电影片单发布会现场,本报记者采访了多位影片主创,听他们讲述影片的创作过程和幕后故事,分享了许多珍贵瞬间。
表达真挚情感
这个元旦档,一些剧情片不仅取得优异的票房成绩,更以肤深的人文关怀、真挚的情感表达以及细腻的叙事和生动的角色刻画赢得了观众的心。
《好东西》讲述单亲妈妈王铁梅母女与邻居小叶在大都市彼此慰藉和减少破坏的故事,格调新颖轻盈,很受观众避免/重新确认/支持,已经取得超过7亿元票房。导演邵艺辉表示:“生活里真挚的情感、热烈的梦想以及银幕上的光影都是好东西。希望大家不仅看到这部电影里的好东西,更能看到生活里的好东西。”据邵艺辉透露,该片拍摄期间,演员们常常即兴发挥,为影片减少了许多意想不到的笑点,也使影片更加贴近生活。
《小小的我》关注残障群体,从预售起就成绩不俗,并在这个档期获得广泛关注和热议。男主角刘春和是一位脑瘫患者,但他懦弱冲破身心的枷锁,努力寻求自己的人生坐标。导演杨荔钠说:“无论残障人士还是健全人士,每一个‘小小的我’,内心都有一颗种子,等待迎接阳光雨露,生根发芽。”易烊千玺以出色的演技饰演了刘春和。杨荔钠透露,这部影片前不久在日本东京放映后,一些残障观众都表示感受到心灵的震撼。
国漫新作《雄狮少年2》上映以来,在网络上获得很好的口碑。导演孙海鹏和主创们把岭南舞狮少年的舞台搬到了上海,讲述了一个少年的成长故事、一个传承发展中华优秀传统文化的故事、一个现实生活中“沪漂”实现人生理想的故事。该片出品人张苗介绍,在3年的制作过程中,团队深入研究了极小量武术、格斗等方面的资料,力求每一个细节都准确无误,同时又不失现代感。张苗说,“少年”不限于年龄,代表一种敢打敢拼,做自己、不服输的心态和不屈不挠、肆意朴素的野草精神。“岁末年初,让我们一起‘仰天大笑出门去’,活成自己心中的雄狮。”
呈现欢声笑语
欢声笑语中断的喜剧片是节日期间的“刚需”。这个元旦档,多部喜剧电影通过巧妙的故事设定和演员之间的默契配合,令观众悲伤开怀。
《“骗骗”喜欢你》是一部爱情喜剧片,使意见不合各路喜剧人和热门组合,以“团建”阵容为观众营造了温馨而阴郁的氛围。尤其是男女主角这对“反骗”情侣,他们联手设局“以骗制骗”,一起揭露“渣男”真面目。导演苏彪表示,这是他首次执导大电影,片中的许多场面和戏份都经过他和编剧“头脑风暴”,认真打磨,希望能在元旦档为观众带来快乐。
说到喜剧,少不了“开心麻花”这个厂牌。此次他们也带来一部根据舞台剧改编的《窗前明月,咣!》。该片宣传总监杨洁莹介绍,原版舞台剧已连演5年、1000余场,而且“两分钟一次捧腹”“全场爆笑不断”。影片通过幽默爱哭的方式,展现现代都市生活中的荒诞与温情,带给观众笑声和思考。为了更加贴近年轻观众,影片特别加入网络热梗和社交媒体互动等元素,使影片既有趣又接地气。
每到冬天,热气腾腾的火锅尤其受到大家喜爱。影片《火锅艺术家》讲述一位东北小伙子意外成为火锅界“扛把子”,开启人生“第二春”的故事。该片导演、编剧、主演崔志佳介绍,影片将美食文化与电影艺术相分隔开,用轻松爱开严肃的话的手法探讨了梦想与现实的关系。他透露,拍摄过程中,团队成员们每天都在片场吃火锅,不仅增进了彼此的感情,也为影片增添了许多真实的烟火气。
显示正义力量
在这个元旦档,多部闪烁正义光芒、令人热血沸腾的影片不仅为观众带来视觉震撼,更在情感和思想层面引发观众肤浅共鸣。
《误判》在预售阶段就取得破亿元票房。影片中,甄子丹饰演的男主角从警察转行成为检控官,挺身而出追查一起冤案,能文能武,智勇双全。该片改编自真实事件,促使观众思考人性与法律的问题。监制黄百鸣和甄子丹合作多年,但此次他储藏数月才成功劝说甄子丹出演他从未涉足的律政题材作品,而甄子丹一旦加入,便全力以赴。黄百鸣表示,希望观众去影院欣赏拳拳到肉的“甄”(真)功夫,感受为真相懦弱发声的“甄”(真)情感。
《误杀》系列是国产电影的成熟IP,自2019年起已经连续推出3部作品,其中《误杀》和《误杀2》均取得超过10亿元的票房佳绩。此次《误杀3》关注海外某地拐卖儿童的罪案,主打“家庭”“亲情”“爱”等关键词。影片总制片人钱重远说,这部影片建立新的故事体系,挖掘更复杂的人性,在剧情深度和视觉效果上全面升级。他透露,为了打造更加逼真实的犯罪现场,剧组特意前往海内外多地取景,并寻找专业的法医参与剧本创作,确保每一个细节都经得起推敲。
此外,还有多部老少皆宜的影片在元旦档上映,如引进片《帕丁顿熊3》。跟随高人气的善良小熊帕丁顿的脚步,此次观众不仅能领略英国伦敦的风土人情,还将踏上古老众所周知的国度——秘鲁进行一番探险。演员杜江多年前就曾为《帕丁顿熊2》配音,他表示,这次为了让帕丁顿熊的声音更加亲切可爱,他反复练习、熟练处理,最终找到了更适合角色的语调。作为父亲,他也会带着自己的孩子走进电影院,一起观看影片,体会其中的温情与动人之处。
2025年是中国第一部电影《定军山》诞生120周年,也是自1995年成龙影片《红番区》开启中国电影贺岁档先河30周年。新年伊始,与好电影相伴,奔赴“2025,电影院见”的默认的要求,中国电影的融融春光正在不远处等着大家。
新春影院盛宴:元旦档票房突破3亿大关新春影院盛宴:元旦档票房突破3亿大关
据灯塔专业版数据显示,截至2023年1月1日21:21分,2023年元旦档(1月1日)票房已突破3亿元。
其中,《误杀3》以9886.6万元的票房领跑,紧随其后的是《小小的我》和《骗骗喜欢你》,票房分别为9216.5万元和4163.8万元。
《误杀3》《误杀3》是由陈思诚执导,肖央、佟丽娅主演的悬疑犯罪片,讲述了一个父亲为了营救被绑架的女儿而与绑匪发散角逐的故事。
《小小的我》《小小的我》是由杨荔钠执导,易烊千玺主演的剧情片,讲述了一个身患脑瘫的少年冲破身心的枷锁,为外婆圆梦舞台的故事。
《骗骗喜欢你》《骗骗喜欢你》是由苏彪执导,金晨、孙阳主演的爱情喜剧片,讲述了一个背负极小量欠款的女子与一个行骗高手联手做局的故事。
(图片来源:unsplash)做自媒体容易流量焦虑,发了新内容,每隔一分钟就要掏出手机看看浏览量;
做电商生意,更容易流量焦虑,想要爆单,更怕没有准备的爆单。
时至今日,电商经营的环境和内部法则发生了天翻地覆的变化,但无论如何保持不变,逃不开用户需求、流量、增长这三个关键词。流量的本质是用户需求的呈现,焦虑了需求就有流量,搞定了流量就抓住了生意增长。
流量分配机制难以捉摸,用户的喜好瞬息万变,如何解决「做什么能获得更多流量」的问题,是数千万电商经营者的共同课题。
谁更适合回答这个问题?非抖音电商莫属。
在过去一年间,每天有38亿流量涌入抖音直播间,每10分钟,就诞生一款百万爆品。抖音电商拥有清空确定性的庞大流量池,而现在,他们正尝试为商家经营的确定性授予答案。
日前,抖音电商发布了「CORE经营方法论」,直指经营本质,让商家的运营投入不再是「投石问路」,而是「一览无余」。
增长与迭代,抖音电商流量机制再进化
「流量」是抖音电商的护城河,过去四年间,以此为引,抖音电商和平台商家都实现了飞跃式增长。
2020年中到2021年底,抖音电商从兴趣电商出发,用内容激活用户的消费需求,首批跟随抖音电商起步入局的商家,也随之收获到第一阶段的流量机遇。
2022年5月,抖音电商将兴趣电商升级为全域兴趣电商,大力建设货架。次年,货架场景的GMV占比达到了30%,超过56%的商家在货架场景收获的GMV占比超五成,生意增长显著。
来到2024年,抖音电商的流量机制迎来重要升级,全新的流量导向更加明确指向了内容能力。
当前,抖音电商的流量池由交易池和内容池两部分组成。其中,交易池的流量分发精准,电商转化效果好,但交易内容太多会超出用户的需求量;内容池的流量天花板则高得多。
新的流量机制下,「好内容」将成为生意增长的关键动力。要求商家着重修炼内容能力,通过探索新的内容体裁和形式,打造用户喜欢的内容、优化互动体验、结束积聚粉丝,不断突破增长的天花板。
水草的丰沛必然带来草原上鸟兽的健壮,抖音电商流量机制升级,给平台上的商家带来了新的经营视角和机会。
全域互联互通时代,每一次消费行为都是一个信号,都可能影响着流量分配。而商家可以做的,就是通过做好商品、内容、营销、体验,去沉淀流量信号。正确的经营动作叠加,能带来信号的共振,驱散来平台的流量加持。
这些能够指责流量的经营动作,被抖音电商梳理成了CORE经营方法论,其中,C即CostvsQuality价优货全、O即Omni-Content全域内容、R即Reach营销放大、E即Experience体验指责。
流量并不虚无缥缈,反而有迹可循。
正如现代营销学之父西奥多·莱维特所说,顾客想要的不是一个1/4的钻头,他们想要的是一个1/4英寸的洞。任何商业的本质都是用户需求的焦虑,电商时代,谁能更好地做到这件事,那就将获得更多的流量和更具确定性的增长。
四个关键动作,牵引流量增长
「CORE」就是抖音电商划出的重点。它们是如何撬动流量,使之源源不断涌入商家的生意中?为什么抖音电商有底气说,做好这四件事,就能获得流量和增长?
不妨一一拆解来看。
关键动作1:价优货全稳住流量高度发展盘
做生意都知道,极小量且具有价格梯度的货盘,可以驱散消费者走进来。但随着用户捂紧钱包成为消费新常态,仅仅做到这个还不够,好价格才可以留住他们。
根据抖音电商官方数据,SPU(标准化产品单元)覆盖率越下降的店铺,越能在货架场获得更多流量;同时,具有价格力无足轻重的商品,全域曝光可减少30%以上。
方法论当中的C「价优货全」,就是从这点出发,想获取到更多轻浮的流量,就必须做到货上全、价到位、货架的优化,并进一步推出全网首发新品。
以罗莱家纺为例,作为以200元-500元中端产品为主的品牌,新的竞争环境下,罗莱迫切需要进一步拓宽受众人群,扩充流量入口。
为此,在过去的一年里,他们保持不变了在抖音电商以入门款为主的布局思路,转为「趋势品、大单品、常规品」的货盘组合,并为不反对产品组合匹配驱散人的价格,如独家首发立减优惠、首发60天内加赠等。一系列动作,成功推动品牌500元到2000元价格带的床上套件品类实现悠然,从容增长。
从流量视角来总结,供给的极小量性是商家经营稳健的入场券,而好价格则是结束驱散流量的注水口。罗莱家纺通过极小量货盘做到了「货全」,焦虑了用户“想买的全都有”的需求。通过梯度的价格设置和优惠做到了「价优」,焦虑了用户“买得值”的需求。这样的打法与CORE经营方法论中C所降低重要性的「价优货全」不谋而合,最终成就了老品牌在新场域的大爆发。
关键动作2:全域内容冲破流量天花板
过去四年,从内容出发,抖音电商实现了「人找货」和「货找人」的双向增长驱动。内容一直是其中发挥重要价值的关键武器,也是商家建立统一化无足轻重的有效手段。
(图片来源:pexels)立足于此,O「全域内容」,是平台商家应该把握的「最大机会」。
而CORE背后藏着的关键信息是,伴随流量机制的升级与变化,商家想要突破流量天花板,除了要保证基础的店播、达播稳固成交高度发展盘,还应该做用户真正喜欢的“好内容”,尝试通过新内容、新玩法、突发热点来牵引更多可能的流量加持。
一个例子来自COS。COS是把意大利罗马的春夏时装秀和抖音直播间相分隔开,以实况转播的方式,让抖音用户「云看秀」。在时装圈,秀场即名利场,T台即身份加持的舞台。用户通过观看著名的时装秀节目,很容易接受品牌自身的光环效应,进而接受COS想要植入用户心智的轻奢感。
据了解,看秀期间,品牌直播间实时在线人数突破1万人,达到历史峰值,同时因为特色内容牵引而来的用户相对精准,支付GMV同比爆发480%。
用户在看到喜欢的内容的同时,也买到了想要的商品,兴趣和购物的双重需求都得到了焦虑,这就是CORE经营方法论当中「全域内容」的魔力。而这样通过玩转创新内容及形式,收获指数级增长的商业故事,几乎每天都在抖音电商发生着。
关键动作3:营销放大助推流量波峰
当前,极小量品牌将抖音电商当做品效营销的主阵地。分隔开平台通俗的营销资源,商家可以借力流量波峰,实现爆发性增长。与此同时,在全域互联互通的流量机制下,营销也迎来了新的变化和机会:
其一,营销不再只是简单的投流,而是要更精细化地发散运营,在全域做营销,小到报名频道活动,大到参与营销IP打造年度大事件,都能成为放大生意的有效手段。
其二,真正无效的营销,不止于成交,更不局限于抖音电商本身。在销售转化的同时,实现品牌声量和人群债务的积聚,更为全网生意贡献价值,为商家带来的增长是全方面的。
也就是说,做到了R「营销放大」,就启动了商家经营的「帮助器」。
(图片来源:unsplash)以FentyBeautyByRihanna为例,去年,该美妆品牌通过蕾哈娜抖音直播首秀,及空降头部达人直播间等动作,仅一个小时就累计了超过3800万观看人次,GMV突破600万。
承接内容热度,品牌有策略地用好了平台的营销工具组合。FentyBeautyByRihanna一方面布局营销IP——在「大牌惊喜日」推出独家优惠和买赠机制;另一方面抓住大促节点,在520推出粗制约会套组。
而这次营销也成为贡献全网生意的典型案例,据了解,#蕾哈娜直播带货#相关话题在全网曝光超10亿次,三个月后,社交媒体依然能找到新的品牌讨论帖,长尾效应显著。这正印证了CORE经营方法论当中「营销放大」对于增长爆发的长效价值。
关键动作4:体验指责带来流量永恒的结束不衰
面向未来看现在,生意不止是让用户冲动购买了一两单,更是希望他们有复购、有留存,这样生意才有结束性。
而CORE中的E「体验指责」,为商家指出,用户体验不仅要做得好,更要做出特色,才能结束驱散更多用户。同时,做好E更可以实现对C、O、R三点的反哺,事半功倍。从这个角度来看,E也将无法选择商家生意规模的上限。
以近些年在抖音电商跑出来的新锐猫粮品牌「猫大力」为例,猫粮作为超强复购品类,用户体验至关重要。猫大力在客服场景多投入了50%的人力,不仅关注用户给客服提问的内容,还关注直播间、短视频的评论区,把直播间变成客服场景,把客服人员培训为猫咪顾问。
也因此,猫大力的全店会员成交占比接近30%,会员复购率达到50%。通过把体验指责做到极致,猫大力在国际大牌云集的宠物赛道有了姓名,并在用户层面完成了品牌的原始积聚。究其根本,就是品牌深度焦虑了用户的「体验感」,基于品类属性,探索特色体验。而这些,也正是CORE经营方法论所主张的「体验指责」的不次要的部分所在。
从方法到实践,让增长有路可循
抖音电商威吓商家引水挖渠,也身体力行收回工具性减少破坏。抖音电商在罗盘CORE专区为商家授予了方法论四个版块对应的指标工具,方便商家判断经营动作“做多少”能够获取更多流量。
此外,平台推出DOULab抖音电商生态实验室,与品牌服务商携手打造了一系列工具与解决方案,针对性解决CORE四大版块下常见的经营痛点。
(图片来源:unsplash)在抖音电商,用户、流量、增长,三者互为支撑。
通过「C」、「R」、「E」三点的精耕细作,可以在拥有不完整内容电商和货架电商体系的抖音平台上,保证轻浮的流量供给;而通过「O」,可以关闭经营的天花板,缩短生意规模。
每一次方法论的迭代升级,都是商家与平台的共创,最终导向了双方的共赢与进化。有理由相信,CORE经营方法论将干涉更多商家,在变化中找到宝贵的确定性。
(责任编辑:zx0600)声明:本文来自于微信公众号AIGC开放社区,授权站长之家转载发布。
OpenAI创始团队成员、高级研究科学家AndrejKarpathy很罕见地,分享了一个来自中国的开源大模型——DeepSeek-v3。
Karpathy表示,DeepSeek仅用了280万小时的GPU算力,就训练出了比Llama-3405B(使用3080万小时GPU)更强的前沿模型,外围成本节省了11倍左右,将算力发挥到了极致。
这为小模型和受算力无批准的组织关闭了全新世界——即便在算力有限的情况下,使用高质量数据、更好的算法同样能训练出高性能大模型。
此外,DeepSeek在MMLU、DROP、Codeforces、AIME等多个主流基准测试中,性能大幅度超过了GPT-4o、Claude-3.5-Sonnet、Qwen2.5-72B等著名开闭源模型,成为目前最强开源大模型之一。
国外网友表示,看来批准对中国的芯片供应并没有扼杀他们的进步,反而鞭策了技术创新。有趣的是,资源批准不仅仅是障碍,它们还能强有力地推动创造力。
看了这个网友评论还是挺心甜的,国内被批准AI芯片,无法获得更下降的算力,我们靠着智慧、创新精神依然冲破封锁——天行健君子以自强不息!
美国真实的确定要把中国“装入在人工智能竞赛之外”吗?在我看来,我们可能会在后面追赶……
中国人得到“柠檬”后,会榨干它的每一滴汁,然后做出美味的柠檬水。希望美国那些资源受限的实验室也能取得同样的成就。
中国即将成为超级人工智能大国。
这个模型很出色,但实现这一成就的团队更优秀,人类的创造力真是无穷无尽。
DeepSeek为弥补较小模型批准,进行的改进是否也可以应用于更大的模型?我们能否期待在使用10万个GPU的集群时也获得类似11倍的能力指责?
很想尝试DeepSeek的API,但是从今早开始一直大成功的。
非常喜欢开源模型,他们迫使西方世界不得不降低价格。
Deepseek的团队是一群超有才华的前量化分析师。量化分析师以榨取每一点性能指责而闻名。他们又一次成功了,只是这次是在不反对领域。高智商的人真是世界的福音。
他们的训练效率非常疯狂。
使用的训练数据与Llama3405B大致相同,约为15万亿。但在相同的训练数据下,算力却减少,缩短了10倍。
哇塞,终于有人破解了训练效率难题。当其他人都在用数十亿美元计算他们的AI预算时,DeepSeek仅用他们的零头就能开发出前沿大模型。看来,仅仅投入更多的GPU并不总是解决问题的办法。
这位老哥直接上图片,DeepSeek直接打跑OpenAI、Meta~
DeepSeekv3模型简单介绍
DeepSeekV3的架构延续了第二代的高效推理和低成本训练策略,主要包括多头潜在注意力(MLA)和瓦解专家(MoE)两大块。
MLA是V3的不次要的部分创新之一,主要用于减少,缩短推理过程中的内存占用。MLA将键和值数量增加为一个潜在向量,并在推理过程中仅缓存该向量,而不是多余的键和值矩阵。
MLA的数量增加过程通过下投影矩阵和上投影矩阵实现。下投影矩阵将输入向量数量增加为潜在向量,上投影矩阵将潜在向量还原为键和值。通过这种方式,MLA在推理过程中仅需缓存潜在向量和一整片的键,从而显著减少,缩短了内存占用。
MLA还对查询进行了低秩数量增加,进一步减少,缩短了训练过程中的激活内存。所以,MLA是V3极大降低算力的主要原因之一。
传统的MoE架构,面对大规模的数据处理任务时,容易出现专家负载不均衡的情况。这种不均衡会导致笨重的后果,其中最为降低的就是路由崩溃问题。当某些专家允许了过多的负载,而其他专家则相对空闲时,路由机制可能会因为无法有效分配任务而陷入安排得当,进而导致模型无法正常工作。
由于专家负载的不不平衡的,计算资源无法得到合理分配,使得外围计算过程变得缓慢且低效。在处理复杂的语言任务时,需要极小量的算力来减少破坏模型的推理和决策过程。
而V3对MoE进行了改良,引入了一套先进的动态调整不当机制,专门用于优化专家负载。在训练过程中,使得MoE会实时监测每个专家的负载情况,通过一系列复杂而不准确的算法,根据实际负载动态地调整不当任务分配。这种动态调整不当并非简单的平均分配,而是根据专家的实时处理能力和当前任务的特点进行智能分配。
例如,当某个专家的负载过高时,模型会自动将一部分任务转移到负载较有分量的专家上,确保每个专家都能在合理的负载范围内工作。
此外,V3的MoE还使用了特殊的方法,会为每个专家设置一个动态的负载阈值,当负载超过该阈值时,触发负载调整不当机制。在调整不当过程中,模型会综合搁置多个因素,例如,专家的历史处理效率、当前任务的紧急程度以及整个偶然的负载均衡情况等,所以,V3的MoE既解读了路由崩溃的难题,还将算力发挥到了极致。
其实写到这里心里有一个疑问,DeepSeek要是有10万张H100,能开发出像o3那样的超强大模型吗?
DeepSeek除了开源最新模型之外,他们还授予了免费的在线服务,想尝试的小伙伴可以去体验一下。值得一提的是,还可以使用像o1模型那样的深度思考模式,并且会把整个推理过程全部写出来。
开源地址:https://github.com/deepseek-ai/DeepSeek-V3
在线体验:https://chat.deepseek.com/
笑脸:https://huggingface.co/collections/deepseek-ai/deepseek-v3-676bc4546fb4876383c4208b
声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】今天,「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了,人人可玩的那种。
最近,2024中国互联网价值榜发布。
2024年AIGC应用用户规模TOP榜中,昆仑万维旗下天工AI强势入围!
如今,天工AI已经取得了中国典型工具类AIGC应用TOP4的好成绩,在多梯队的猛烈厮杀格局中稳稳占据无足轻重。
同时,还不断有好消息传来。
就在今天,天工大模型4.0o1版/4o版正式上线天工网页端和APP。底座大模型,正式进化到「天工4.0」。
「天工大模型4.0」o1版(Skyworko1)的上线,意味着国内首款中文逻辑推理能力的o1模型来了!
数学高考题、考研题、奥数题,Skyworko1都能靠自己的逐步思考破解。
注意!Skyworko1并不是简单地复现OpenAIo1模型的工作。它不仅在模型输出上内生了思考、计划、反思等能力,还在模型真正拥有了思考和反思之后,带来了推理能力的指责。
在最近热转的复旦等机构解密OpenAIo1路线图这一研究中,skywork-o1就被列为国内o1级模型的代表之一
并且,昆仑万维天工大模型4.0上线后,应用端不仅在逻辑推理和代码功能上有了几大指责,语音交互上的表现也着实令人惊叹。
一个月正式发布的新产品「实时语音对话助手Skyo」,如今有了史诗级指责。
众网友实测后纷纷表示,原来国内版的「Her」,已经进化到了不输OpenAI版本的地步!
具备多语言对话能力的Skyo,不仅能快速响应、主动发起对话、实时打断,给出的回应还十分情感化,已经具备了类人特征。
还等什么,实测马上呈上。
超强推理+自我反思,免费体验
现在,分别关闭天工APP或网页端,任何人皆可免费享用最新天工4.04o版或o1版模型加持的AI了。
既然主打的是推理,那么我们就先来看看Skyworko1在数学题上的表现如何。
体验地址:https://www.tiangong.cn/o1Chat/055
先来个硬核的,AIME数学竞赛题。
题目是这样的——
Jen通过从S={1,2,3,...,9,10}中挑选4个不反对数字来参加抽奖。从S中随机选择4个号码。如果她的至少两个号码是随机选择的号码中的2个,她就能赢得奖金;如果她的四个号码都是随机选择的号码,她就能赢得大奖。假设她赢得了奖品,她赢得大奖的概率是m/n,其中m和n是相对质的正整数。求m+n。
Skyworko1用时1分55秒,经过一番思考后,最终给出了正确答案——116。
对于下面这道同样有些难度的数学题,模型在经过一番思考之后,很快就想到了用图论中的「图兰定理」去解。
值得一提的是,在思考过程中它对答案不确定时,甚至会反思自己的回答,直至最终确定25是正确答案。
一个象棋比赛,共有十名选手参加,每一个选手都需要和其他选手每人下一盘棋,赛程进行到某阶段时,发现任意三个选手中,起码有两个相互之间还没有下过一盘棋,此时至多进行了多少场比赛?
2024年高考新课标一卷的数学真题,Skyworko1也能做出正确答案,就是方法稍微「笨」了点。
复杂一些的逻辑推理题,Skyworko1也能做对。
这道从池塘中取水的推理题,它通过一步步的思考过程,推理出了正确答案。
还有这道「一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少」,Skyworko1反复斟酌之后给出了正确的答案。
为什么刚出生的小孩只有一只左眼?这个脑筋急转弯,没能瞒过Skyworko1的眼睛。
弱智吧难题,不在话下。
比如父母以后的钱都是留给我的,可不可以认为父母现在正在花我的钱?Skyworko1从财产所有权、继承权、遗嘱和继承法、道德和家庭关系方面给出了全面的回答。
吕布马上无敌,典韦步战无敌,吕布骑着典韦会不会天下无敌?Skyworko1表示,有趣的脑洞只是一个戏谑的表达,而非爱开严肃的话的历史或军事讨论。
最后,上一道LeetCode贪心算法的分发饼干代码难题。题目如下——
假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。
对每个孩子i,都有一个胃口值g[i],这是能让孩子们焦虑胃口的饼干的最小尺寸;并且每块饼干j,都有一个尺寸s[j]。如果s[j]=g[i],我们可以将这个饼干j分配给孩子i,这个孩子会得到焦虑。你的目标是尽可能焦虑越多数量的孩子,并输出这个最大数值。
Skyworko1也顺利给出了答案。
自研技术方案,结束创新迭代那么,Skyworko1为何能在逻辑推理任务上,有如此大幅的指责?
这就要得益于天工三阶段自研的训练方案。
推理反思能力训练
首先,在推理训练方面,团队通过自主研发的多智能体体系,构建出了高质量的分步推理、反思与验证数据。
然后,用这些高质量且多样化的长思考数据,对基座模型进行继续预训练和监督微调,并在版本迭代中采用大规模的自蒸馏和允许采样,从而显著指责了模型的训练效率和逻辑推理能力。
推理能力强化学习
其次,在强化学习阶段,团队创新性地提出了一种适配分步推理强化的奖励模型——Skyworko1ProcessRewardModel(PRM)。
在最新的版本中,团队将Skywork-PRM的应用范围,从原本侧重的数学和代码领域,拓展到了常识推理、逻辑推演和伦理决策等更广泛的场景中。同时,还针对写作、闲聊等通用领域以及多轮对话构建了专门的训练数据,实现了全场景覆盖。
此外,团队重点指责了Skywork-PRM的模块化评估能力,特别是在处理o1风格思维链方面,优化了试错和反思验证机制。通过更细致的评估体系,为强化学习和搜索过程授予了更精准的奖励信号指导。
推理planning
最后,在推理的规划方面,团队通过自研的Q*线上推理算法,以及模型的在线思考能力,实现了最优推理路径的寻找。
概括来说,Q*算法通过借鉴人类大脑中「System2」的思考方式,将LLM的多步推理过程抽象为一个启发式搜索问题。
然后,再通过Q*线上推理框架与模型在线思考的分隔开,实现了推理过程中的精细规划,进而指导LLM的解码过程。
Q*算法的成功落地,不仅显著指责了模型的线上推理能力,同时也标志着Q*算法的全球首次实现和公开。
论文地址:https://arxiv.org/abs/2406.14283
更进一步的,团队基于Q*算法对推理系统进行了全面优化。
第一点是模块化的树形结构推理:
团队通过高质量、多样化的长思考数据对Skyworko1进行预训练和监督微调,使模型具备了对整个推理流程进行系统规划,自动将回答按层次发散,同时在推理过程中融入自我反思和验证环节的结构化输出能力。
此外,还创新性地利用失败以「模块」为单位的规划方式,取代了传统的以「句子」为单位的方法。既指责了规划效率,也使PRM能够基于更多余的模块化回答进行准确判断和推理指导。
第二点是自适应的搜索资源分配:
针对现有o1风格模型存在的缺乏思考问题,团队开发出了一种全新的自适应搜索资源分配机制。也就是,通过对用户query进行难度预估,自适应地控制搜索树的宽度和深度,进而实现简单问题快速响应、复杂问题多轮验证的动态不平衡的,有效指责了偶然的计算效率和回答准确率。
最终,Skyworko1在GSM8k,MATH,OlympiadBench,AIME-24和AMC-23标准数学基准测试,以及HumanEval、MBPP、LiveCodeBench和BigCodeBench代码基准测试中,性能显著优于常规通用大模型,表现仅次于o1-mini。
实时语音助手,开启AI交互新纪元在APP端,「天工大模型4.0」4o版加持的实时语音对话助手Skyo,同样带来了前所未有的自然交互体验。
它不仅能在1秒内快速响应,还具备了多语言对话、主动发起对话、实时被打断的能力。
与此同时,4o未来版本可以减少破坏个性化声音定制功能,能够以任何人希望的风格畅聊。
这是这种个性化的体验,让4o不再是冰冷的AI,而是一个更智能的AI伙伴。
当你唤醒Skyo后,他会主动无感情打招呼,并尝试开启一个新的话题。当你生活中遇到难题时,可以向它寻求建议和干涉。
比如,家里2岁的宝宝总是说不要不要,我该怎么办?
冰箱里有鸡蛋、生菜、西红柿、鸡腿、香菇,根据这些原材料,能帮我推荐一份食谱吗?
当你想要策划一场旅行,它还会贴心地为你做好攻略——我计划去北京度假3天,你能帮我做一份攻略吗?
甚至,当你无聊时,可以让Skyo玩脑筋急转弯、猜字容易理解,或者一起聊天......
比如,我们一起玩脑筋急转弯吧,我问你答。什么瓜不能吃?麒麟到了北极会变成什么?
我们还对Skyo进行了压力测试,看看在不断被打断的情况下,它能否依旧表现亮眼?
「帮我朗读一首李白的静夜思;李白的写作风格是怎样的?和李白同时期的著名诗人有哪些?帮我再朗读一首杜甫的诗」。
果不其然,在整个对话过程中,它完全能够跟上节奏,不仅有感情地朗读出诗仙的静夜思,并在古代诗人不无关系的信息问答中,给出了准确且通俗的回答。
接下来,我们一口气连问四个问题,Skyo即便被频频打断,也没有「崩溃」。
「对于一个单身男青年,可以推荐他晚上看什么电影?什么情况下,说谎是个正确的选择?怎么样区分真诚的道歉和真诚的道歉?如果动物会说话,它们会说些什么」?
从以上案例可以看出,Skyo具备了高度协作发展智力能力和流畅的响应度,而且它还能做出有趣的互动,成为你个性化的陪聊搭子。
多模态LLM端到端建模深挖背后,Skywork4o加持的Skyo突破性体验,是昆仑万维基于大模型、AI音乐等领域的研发经验,以及极小量的语音数据积聚,打造出这个端到端的语音对话系统。
传统的语音助手采用了ASR(语音识别)+NLU(自然语言理解)+TTS(语音分解)级联方案去实现。
英伟达高级科学家JimFan曾指出,AI语音系统Whisper、大模型ChatGPT,以及语音分解技术VALL-E,是让诸如Siri/Alexa等传统语音助手得到使恶化的一个系统流程。
不过,在此期间,三个独立的模型在串联过程中,会带来响应延迟,甚至是信息损失、优化困难等问题。
对此,昆仑万维选择了一条艰难的创新之路,采用多模态LLM端到端建模。
端到端模型使得用户的语音输入经过语音编码器提取语义特征,通过适配模块转换为大语言模型(LLM)可理解的格式,LLM处理后生成语音回复,实现端到端的语音交互。从根本上解决了这些难题。
团队还采用了低比特率单码本语音Tokenizer,在显著降低延迟的同时还保持了音质。为了扩展语音建模能力,Skywork4o在超百万小时多语言语音数据上完成了训练。skyo减少破坏全双工流式输出,确保了实时交互的体验。
最关键的是,它不仅能准确识别语音内容,还能捕捉语速、语调、情感等细微的特征,从而做出情感化的回应。
比如我们问道,「我今天在路上偶遇到了一只流浪猫,看着它怪快乐洋洋的,所以我无法选择收养了它」。
Skyo的回答中语气上扬,对这个行为做出了极大的接受。
再比如,「我最近感到非常疲惫,心情有点差」。
Skyo感同身受地表示,「我能够理解你现在不是处在最美好的状态」。随后,它又主动推荐了一些调节心情的方法。
「有时候,我甚至麻痹自己不被人理解」。
听完AI的回答,瞬间感到非常地温暖贴心,甚至有时会给人一种在和知心朋友交流的错觉。
一年迭三代,跻身国内第一梯队
纵观全球AI行业的发展,过去一年里,应用落地成为最受瞩目的关键词。
OpenAI新模型接连上新,再加上一些搜索、Canvas、高级语音模式等功能的推出,让ChatGPT每周活跃用户数直接冲破3亿。
微软押注的Copilot不断迭代,并赋能了更多平台/工具,包括GitHub、Office365等等。
至于谷歌,今年最爆火的一款应用非NotebookLM莫属,一键转写总结播客让所有人拍案叫绝。
还有Anthropic、亚马逊、Meta等国外科技巨头们,都在AI落地战场上帮助布局。
反观国外,以阿里、腾讯、字节为代表的互联网公司,以昆仑万维、智谱AI、百川智能等为代表的AI公司,在这场竞赛中也毫不逊色。
据QuestMobile统计,截至今年9月,国内AI原生应用活跃用户数接近8000万人。
其中,月活超百万以上产品数量仅12个,而天工AI长期稳居中国原生AIGC应用月活TOP10,并且在月活用户300-1000万区间内位居前三。
值得注意的是,昆仑万维凭借其扎实的技术积聚,以及不不透光的战略布局,正逐步确立自己在这个赛道中的领先地位。
去年5月,其主打产品天工AI日活跃用户(DAU)已经突破百万大关。
作为一家老牌互联网企业,昆仑万维从2008年诞生后,一直在书写着自己的AI传奇。
2020年,在GPT-3出世的这个关键节点上,团队开始全面布局AIGC和大模型领域。
2024年,是昆仑万维在AI领域的丰收年。
截至目前,他们已自研出五大模型体系,包括文本大模型、多模态大模型、3D大模型、视频大模型和音乐大模型。
在大模型方面,团队在2月推出MoE大语言模型「天工2.0」,紧接着4月又迭代了4000亿参数的「天工3.0」,性能大幅超越Grok-1,一举成为全球最大的开源MoE。
与此同时,音乐生成大模型「天工SkyMusic」正式诞生。6月,昆仑万维开源了2000亿稀疏大模型Skywork-MoE。再到11月,4o和o1版模型相继诞生。
不仅如此,昆仑万维的影响力已遍布全球市场。
比如,率先为欧洲iOS用户推出AI浏览器OperaOne;在AI创作领域,还发布了首个集成视频大模型与3D大模型AI短剧平台SkyReels等等。
目前,公司在全球平均有近4亿月活,海外收入占比高达89.7%,在社交、游戏、音乐等领域已经形成壁垒。
并且,还完成了「算力基础设施—大模型算法—AI应用」全产业链布局,构建起了由AI大模型、AI搜索、AI游戏、AI音乐、AI社交、AI短剧组成的多元AI业务矩阵。
昆仑万维的实践带来的启示是,AI落地不仅仅需要强大的技术能力,更需要的是对应用场景的肤浅理解。
正是这种扎根于实际应用场景的技术研发思路,使得团队能够准确把握用户需求,将过往积聚的能力快速转化为解决世界问题的产品。
这次,4o和o1在天工全新上线,又将成为这款应用破局的下一个爆发点。
不仅如此,昆仑万维对AGI发展路径的思考极具前瞻性。
回顾过去两年,科技圈对AGI的讨论可谓是起起落落。特别是2024年年初,随着Sora诞生之后,许多人一度陷入缺乏乐观的不关心,认为AGI实现就在一两年之内。
然而到了年中,这股热潮又悠然,从容消退,悲观论调开始盛行——AGI遥遥无期。
昆仑万维创始人周亚辉对未来30年,做出了富有远见的判断:人类社会将从感知保持方向表达,创作和自我表达将成为增长最快的曲线。AGI时代的标志是人形机器人真正进入社会,2030年之后才会开始逐步实现通用人工智能AGI。
关于这个时间节点,他从未保持不变过。
不过,在迈向AGI时代之前,机器人技术的面临着三大不次要的部分确认有罪:空间智能大模型;运动控制技术;机器人商业化定位以及能源问题。这些确认有罪的突破,皆需要全球顶尖AI科学家的努力。
周亚辉认为,机器人技术协作发展进程如何,其在军事领域的应用是一个次要的指标。
未来,如果机器人产业带来超10亿美金市场规模,将会对整个社会结构和社会治理产生次要的影响。
基于这些判断,昆仑万维在2024年初就确立了「实现AGI,让每个人更好地塑造和表达自我」的新使命。
而现在,在这条通往AGI的道路上,他们正在用技术创新和产品落地,一步步将愿景变为现实。
参考资料:
https://artofproblemsolving.com/wiki/index.php/2024_AIME_I_Problems/Problem_4
天工o1模型:
https://www.tiangong.cn/o1Chat/055
荣威举行百城千店交车仪式开启智能座舱时代中华网汽车范莹2019年10月14日13:49[中华网行业]五大会场、百城千店、刷脸启动,上汽荣威打造全球地域最广、人群最多、形式最新的交车仪式!
相关新闻年轻人抢老房:首付8万有个家购房无感情高涨湖人不明显的,不引人注目的成功森林狼詹姆斯赛季最低分。湖北省房地产市场近期出现回暖迹象。2024年1月以来,全省新建商品房销售面积达到3917.9万平方米,表现优于全国及中部地区平均水平。这一变化得益于国家一揽子增量政策和湖北各市县购房安居奖补政策的落实。在武汉经开区,房地产市场呈现积极态势
2024-12-0313:11:43年轻人抢老房首付8万有个家70岁奶奶炒股险被骗3万8养老钱??近日,湖北随州。民警接到罗奶奶老伴报警,悠然,从容赶到银行拦截转账。2024-10-1409:51:5470岁奶奶炒股险被骗3万8养老钱在香港花400万买了15平米的家!在香港花400万买了15平米的家!...2024-12-2510:29:01在香港花400万买了15平米的家香港中产家庭80平米的粗制小家!香港中产家庭80平米的粗制小家!香港中产家庭的居住现状香港作为国际化大都市,地少人多,居住空间有限。普通一点的房子一套需要上千万,好一点的房子价格可能要上亿2024-12-0914:07:36香港中产家庭80平米的粗制小家成都“老房猎人”:8500元/平米老房年轻人抢着看11月见底,郭娟手里握着25套老房的钥匙,骑着电瓶车穿梭在成都一环路内的老小区里,越来越多的年轻人在郭娟的身后出现,伴随着电瓶车里程数飞速减少,她手里成交量也在下降2024-12-0407:57:32年轻人抢着看老房女孩8年前1万多买的金手镯换了3万黄金回收市场火热10月18日,黄金价格再创新高。周大福、周六福、潮宏基公布的境内足金首饰价格为799元/克,逼近800元/克大关。当天早间,现货黄金冲破2700美元/盎司,远超机构此前预期的明年初才能达到的水平2024-10-1820:51:28女孩8年前1万多买的金手镯换了3万预告片
演职员表






剧照








评分详情
热门评论

