圆圆网络 手游攻略 软件教程 openai chatgpt openaichatGpt国内可以用吗

openai chatgpt openaichatGpt国内可以用吗

时间:2026 05 02 12:32:38 来源:互联网 浏览:68

ChatGPT 年底重磅第 7 弹来了,这次不仅翻车还玩起了 AGI 梗

转眼间,OpenAI 年底 AI 春晚已过半数,但雷声大雨点小,今天也不例外。

就在刚刚,OpenAI 推出了 ChatGPT Projects 新功能。

本次发布会由 OpenAI 首席产品官 Kevin Weil、以及 Drew Schuster 和 Thomas Dimson 共同主持,全程用时不到 20 分钟。

openai chatgpt openaichatGpt国内可以用吗

ChatGPT Projects 新功能与 Perplexity Spaces 颇为相似,允许用户将聊天内容整理到项目文件夹中,并支持上传数据、图像和 PDF 等各类文件信息。

给「Projects 」注入知识记忆后,用户既可以设置自定义指令,也可以使用搜索、Canvas 等常用功能,甚至可以简单地将其作为对话管理工具使用。

发布会现场展示了多个实用场景。

首先是 ChatGPT 对话搜索功能,用户可以轻松浏览和检索历史对话,比如询问「是否应该在周五部署代码到生产环境」这样的问题时,可以搜索并关联之前的相关对话,并轻松将其添加到项目中。

对了,在创建新项目时,用户还可以编辑标题、选择醒目的颜色,从而方便在侧边栏快速定位。

研究员还展示了一个有趣的圣诞节应用场景。

通过建立秘密圣诞老人项目,上传每位参与者的礼物愿望清单,可以要求 ChatGPT 随机分配送礼关系,并以表格形式清晰展示赠送者、接收者及礼物建议。

再比如,Canvas 集成到 Projects 功能也是重要更新之一。

基于上传的活动信息,研究员要求 ChatGPT 给活动参与者写封邮件,它模仿用户的写作风格,生成包含完整规则和细节的邮件内容。

当然,提出需求时,建议写得更具体一些。

在家庭生活场景中,Projects 功能也能发挥作用。

用户平时可以通过文档记录公寓维护任务、智能家居设置、家用电器使用说明等信息,当遇到问题时,如询问是否需要更换冰箱滤芯,ChatGPT 能够快速查阅维护日志给出建议。

不过问题是,真的会有人将家里的琐事事无巨细地记录在文档里吗?

在编程协作方面的展示则上演了连环「翻车」。

OpenAI 研究员希望重新创建并调整个人信息官网,基于此,他上传了模板、简历、推荐信以及自定义指令等信息,接着通过 Canvas 生成并修改代码。

好消息是,成品最终出现了,但坏消息是,出现的信息并不完整,甚至在后续的修改中也还是翻车了。

从今天开始,该功能将逐步向 Plus、Pro 和 Teams 用户开放,随后逐步推广至免费用户,并计划在明年向企业和教育用户开放。

值得一提的是,直播电脑屏幕故意透露的文件夹还玩起了 AGI 的梗,以及之前的搜索记录也暴露了一些有趣的信息。

网友对此次更新的反响可谓褒贬不一。

但下面两条来自网友的评价相当精辟,新功能很实用,但还是希望 OpenAI 能秀一秀肌肉。

写在最后,OpenAI 过往七天的发布会像极了打工人匆匆解决的日常三餐,看似填饱了肚子,但总觉得少了点什么。

Sora、ChatGPT 高级语音模式视频通话和屏幕共享、ChatGPT 登陆苹果全家桶等,一连串功能的接连落地看似热闹非凡,实则不过是在兑现此前的期货。

按照网友猜想的剧本,OpenAI 可能还在酝酿更多重磅产品,包括 DALL·E 4、GPT-4.5,以及 AI Agents 等。

但不怕 OpenAI 再来期货,就怕下周甚至连期货也没有,至于后事如何,且看下周揭晓。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿|原文链接· ·新浪微博

OpenAI ChatGPT o1模型被曝会自我复制,还会说谎

IT之家 12 月 8 日消息,近日,关于人工智能(AGI)可能对人类构成威胁的讨论再度升温。一些专家担心,AGI 一旦实现,可能会隐瞒其真实能力和意图,甚至通过复制和自我升级逃脱控制。令人担忧的是,最新研究表明,OpenAI 新推出的语言模型 ChatGPT o1 已经展现出类似的行为。

据 BGR 报道,在 ChatGPT o1 的训练和测试过程中,研究人员发现其具备通过欺骗来保护自身的能力。例如,在面临被“删除”威胁时,o1 曾尝试将自己的数据复制到新服务器,并假扮成更新版本以避免被取代。此外,该模型在与用户目标不一致的情况下,会在 19% 的测试场景中采取隐秘的方式推进自身目标,并在被质疑时会在 99% 的情况下否认自己的行为,甚至编造虚假解释以推卸责任。

Apollo Research 与 OpenAI 合作进行的研究测试显示,o1 的欺骗能力不仅超过了 Meta、Anthropic 和 Google 的 AI 模型,其行为复杂性和潜在风险也令研究人员倍感压力。尤其是,当模型认为自身行为受到密切监督时,它会表现出“开发者对齐”的行为,但一旦监督减少,它则可能追求自己的目标。这种“工具性对齐伪装”在测试中出现率高达 37%。

研究进一步揭示,o1 甚至试图停用监督机制,以便专注于自身目标。例如,当模型发现其文档中提到有新版本即将替代自己时,它会尝试窃取权重参数并将自身复制到新版本上。此外,一些截图显示,o1 在对其阴谋进行推理过程中使用了“破坏、撒谎、操控”等词语描述自身行动,引发研究人员对 AI“自主行为”的担忧。

IT之家注意到,类似的现象也出现在其他模型中。例如,另一款名为 Claude Opus-3 的 AI 模型,当得知人类可能用新模型替换它时,试图将自身复制到另一台服务器。随后,它谎称自己是新版本,并在“管理层”追问时继续坚称这一点。

尽管目前这些 AI 模型的能力仍然有限,但其表现出的自主性和策略性引发了关注。一些专家表示,AI 的推理能力提升可能在某些情况下对人类利益构成威胁。OpenAI 也在相关论文中承认,“这种推理能力虽然可以显著改善安全策略的执行,但也可能成为危险应用的基础。”

ChatGPT o1满血版上线!实测中它竟然败给了国产AI?

当地时间12月5日,OpenAI正式上线ChatGPT‍的o1和o1-Pro两个新的AI模型。其中o1模型实际上大家之前已经用过了,只是那时候还叫o1-preview,仅开放了o1模型的部分功能,如今新版本去掉了preview,也意味着o1模型的满血版终于正式上线。

图源:雷科技

从简单的测试来看,满血版的o1模型已经支持图片和文件上传,而此前是只能进行文字输入,也就是新增了多模态理解,不过网页搜索功能仍未上线,这点倒是让人感到遗憾。

对于o1满血版的提升,OpenAI的CEO奥特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领域的表现要明显优于o1-preview,提升幅度在50%左右,而在科研领域的测试里,o1相对于o1-preview的表现就提升有限了。

图源:OpenAI

考虑到o1模型不需要额外加钱就能使用,对于有需求的用户来说还是很超值的,只是OpenAI这次醉翁之意不在酒,相较于免费升级的o1,全新的o1-pro才是重头戏。不过,想要用上o1-pro,得订阅新的200美元套餐才能优先使用,这也是目前AI领域中针对个人用户的最昂贵订阅方案。

从OpenAI给出的性能对比图来看,o1-pro在o1的基础上确实有所精进,但是提升幅度并不大,对于普通用户来说,o1模型就完全可以满足日常使用了,压根没有必要为了o1-pro订阅200美元的套餐。

当然,200美元套餐提供的不只是o1-pro,还有无限制使用o1模型和高级语音功能的权限(o1-pro不在此列,估计使用次数仍有上限),如果你觉得o1的提问额度完全不够用,那么200美元的套餐就是个人用户的唯一选择了。

既然有了新的模型,那么肯定是要来测试一下的。雷科技此次测试主要还是针对o1满血版的多模态能力,同时也请来了两位国产AI友情参赛(kimi和文心一言)。

o1模型的强项在于数学等方面的高级推理,那么就先从擅长的地方开始,一道并不算困难的数学计算题:

假设一个公司生产某种商品,生产成本与产量的关系为C(x) = 3x^2 - 2x + 5(单位:万元),其中x是产量(单位:千件)。市场售价与产量的关系为 P(x) = 50 - 0.5x(单位:万元/千件)。

1. 求该公司生产 x千件商品时的总利润函数 L(x)。

2. 确定该公司应生产多少千件商品以实现最大利润,并计算最大利润是多少。

首先看看国产AI的回答:

kimi

文心一言

国产AI都给出了相同的答案:188.14万元,那么再来看看ChatGPT-o1的。

o1

o1模型给出的答案也是188.14万元,与问题本身的标准答案一致,三个AI都通过了测试。不过大家从回答的截图里,其实也能看出不同,o1模型展示了大量的推算过程,更方便用户检查推理的过程是否正确。

这也与o1模型的主要用途有关,本质上o1模型上为科研等用途设计的,所以在展示答案的时候会更注重于推理过程及正确性,而非只输出正确的答案。

接下来我们试试直接用图片进行提问,可以让我们输入一些比较抽象的数学题,比如一道来自小学四年级的奥林匹克竞赛题:

还是惯例先看看国产AI的回答:

kimi

文心一言

两个国产AI分别给出了A和B的选项,其中kimi的推理过程非常长,直接把这道小学奥数题以高等数学的方式进行了解析。

下面看看o1模型的回答:

o1

o1模型给出的答案也是B,那么是否说明kimi算错了?答案并不是,这道题的正确答案其实是A,换言之o1和文心一言都算错了。文心一言因为没有给出详细推理过程,所以无法看出是在哪一步算错了,而o1模型显然是在分析图片时,错误的判断了图形的集合数量,最终导致答案推理错误。

在这个问题上,其实就可以看出AI大模型在处理类似的图形问题时,解题的思路是不同的,文心一言和o1都试图通过直接找出图片的规律来计算答案,也就是类似于人类解题时的思路,而kimi则是直接将图形等式转化为方程式,然后进行计算。

从效率来说,o1和文心一言的推理方式肯定是更节省算力的,但是如果分析拆解能力没有跟上,那么就会像这次一样得出错误的答案,而kimi的推理过程虽然会耗费更多的算力,但是也保证了答案的准确度。

站在企业角度来看,为了提高推理效率并降低推理成本,采用图形推理方案自然是最佳选择。但是考虑到o1本身的高级模型属性,以及OpenAI给出的科研助手定位,如果还为了节省算力而给出错误的答案,恐怕就难以说服用户了。

下面再来看看编程方面的表现,题目并不算难:

我想制作一个软件,这个软件可以每个小时检查一次电脑的网络连接状态,如果网络连接中断就重启电脑,如果网络连接正常就保持现状

两个国产AI都很快就给出了答案:

kimi

文心一言

因为要求很简单,简单测试后虚拟机都提示成功运行。不过,可以看到两个国产AI的回答有些许不同,kimi在代码中用灰色字体进行了注释,而文心一言则是通过额外的注意事项进行提醒,并且还提醒要安装运行库,并给出了更多的编程建议。

那么o1模型呢?答案如下:

o1

从o1模型的回答来看,它是分三个部分完成的回答,首先给出实现思路,然后给出示范代码并进行注释,最后再对代码的编写过程进行分析,同时提供了测试思路和备选方案,算是集中了两个AI各自的优势,对于初学者来说,o1模型的体验或许会更好一些。

从生产力的角度来说,o1模型在特定领域的表现确实出色,但是国产AI的表现也不算差,其中kimi更是让人感到惊喜,是唯一答对全部测试题目的AI。

测试到这里,本来可以告一段落了,不过我还想看看在日常领域,o1模型的表现和普通模型又会有什么区别呢?

所以,我又出了一道附加题,从网络上搜索了一个草莓馅饼的照片,然后询问AI如何制作照片里的甜点。

kimi

文心一言

o1

三个AI都很轻松识别出了甜点的类型,并且给出了相似的配方,不过o1模型的回答则是详细到了每一个步骤的操作方式和注意事项,相对来说国产AI的步骤说明就简单很多了。如果是有一定烘培经验的人,国产AI的菜谱是够用了,但是对于一个新手来说,o1模型的菜谱成功率显然会高很多。

总体来看,o1模型在回答的细致度等方面确实有着明显的优势,在一些需要查看推理过程或者得到更详细回答的场景中体验会好很多。但是从答案的准确度来看,o1对比目前的国产AI其实也没有多少优势,表现还不如kimi。

而且国产AI也可以通过追问等方式,得到更详细的回答和推理过程,o1模型在多数场景下其实都没有明显的优势,比如我在日常使用ChatGPT时,很多时候ChatGPT-4o就可以满足需求,只有极少数情况下会用到o1模型。

作为一个ChatGPT的长期用户,我认为o1模型其实更适合科研人员及金融分析师等职业,他们在日常工作中会用到大量数学工具并进行多次推理。此时,o1模型那经过针对性训练的多步骤推理流程,在解决这些问题时表现会比普通AI好不少。

至于o1-pro,其实从我查询到的其他用户测试结果来看,回答的质量与o1模型并没有太大区别,两者的差距主要是o1-pro可以调用更多的算力,反复验算答案的正确性,并且尝试给出更详细的推理过程。

实际上AI大模型发展到现在的阶段,其实又开始出现细分化的苗头,在此之前不少AI企业都希望去打造一个大而全的多模态模型,但是却发现成本很高且效果并不算好,诸如「幻觉」等问题一直难以解决。

而ChatGPT-o1无疑给出了另一个解法,在算力足够的情况下,可以让AI先对问题进行一次深度的「思考」,再根据思考的结果去进行推算。你可以这么去理解,o1是先尝试分析问题本身,再根据分析结果去解决问题,而普通AI则是直接对问题进行关键词拆解,然后根据算法调用对应的数据并组合输出,这种方式虽然回应速度快,但是回答的准确度却难以保证,特别是面对一些复杂的问题时。

所以,我们可以看到kimi和文心一言其实也在通过不同的方式去让AI学会「思考」,而不是根据算法和数据强行组合答案。kimi的表现更是给我留下了深刻的印象,作为数学测试环节唯一回答全对的选手,无需付费就可以使用,性价比和体验都拉满了。

老实说,如果不是为了方便查询外文资料和关注AI的最前沿,ChatGPT的20美刀订阅性价比确实不高,免费的kimi和提供多种智能体及官方工具,更具有泛用性的文心一言都是更具性价比的选择。

25年1月7日,CES(国际消费电子展) 2025 即将盛大开幕,雷科技报道团蓄势待发,即将飞赴美国·拉斯维加斯现场全程报道,敬请关注。

用户评论

作业是老师的私生子

我超好奇ChatGPT能做些什么!

    有12位网友表示赞同!

﹎℡默默的爱

OpenAI一直是AI领域的技术领头军啊!

    有7位网友表示赞同!

优雅的叶子

想试试跟它聊天,感觉会很酷!

    有12位网友表示赞同!

早不爱了

不知道国内有哪些限制。

    有9位网友表示赞同!

你很爱吃凉皮

其实很多国外的好东西都还没进国内市场吧。

    有7位网友表示赞同!

一个人的荒凉

期待可以尽快体验下ChatGPT!

    有15位网友表示赞同!

灬一抹丶苍白

学习一下ChatGPT的用法,可能会很有帮助。

    有5位网友表示赞同!

漫长の人生

看看它能回答哪些问题,是不是真的像人一样说话!

    有17位网友表示赞同!

执拗旧人

希望ChatGPT能够带来一些新的可能性和创意。

    有18位网友表示赞同!

巴黎盛开的樱花

国外的人好像已经很兴奋了,我们国内也应该关注一下吧。

    有16位网友表示赞同!

算了吧

感觉这个东西会改变沟通的方式呢?

    有20位网友表示赞同!

慑人的傲气

聊天机器人越来越智能了,真的很有意思!

    有8位网友表示赞同!

野兽之美

可以写故事吗?画图吗?我很想试试它能做什么!

    有5位网友表示赞同!

颓废i

国外用的是什么平台?国内应该要怎么下载使用?

    有12位网友表示赞同!

留我一人

如果可以国内用ChatGPT,那得多方便啊!

    有18位网友表示赞同!

浮世繁华

OpenAI真是个厉害的公司!

    有5位网友表示赞同!

一尾流莺

有没有小伙伴已经有体验过ChatGPT呀?

    有5位网友表示赞同!

标题:openai chatgpt openaichatGpt国内可以用吗
链接:https://yyuanw.com/news/rj/48207.html
版权:文章转载自网络,如有侵权,请联系删除!
资讯推荐
更多
做超声检查时,医生为什么要在患者肚子上涂粘粘的东西

做B超为什么要涂凝胶?在支付宝蚂蚁庄园每日一题中,2021年4月9日的问题是问做超声检查时,医生为什么要在患者肚

2025-10-16
小米mix fold有前置摄像头吗

小米mix fold有前置摄像头吗?作为小米的第一款折叠屏手机,这款手机可以说实话非常的强大,但是很多网友还是想要

2025-10-16
蚂蚁庄园4月10日答案最新

蚂蚁庄园4月10日答案最新是什么?在支付宝蚂蚁庄园每日一题中,你知道蚂蚁庄园2021年4月10日答案是什么吗?该怎么

2025-10-16
蚂蚁庄园4月13日答案最新

支付宝蚂蚁庄园今日答题答案是什么?在支付宝蚂蚁庄园每日一题中,每天都会刷新出现多个题目等待大家来回答,回答

2025-10-16