测评文章还没写完,ChatGPT先崩了!Alpha GPT-4

2023-11-13 14:31:59 浏览数 (1)

上周 OpenAI 官方已开始灰度测试 Alpha GPT-4 (All Tools),所有普通账户都有概率 (1%-3%) 获得一个 GPT-4 (All Tools) 模型选项。

功能方面:Alpha 几乎集成了 PLUS 用户的所有功能,

  • 知识库更新到了2023年4月,支持 GPT4-32K
  • 可以上传、识别图片
  • 可以上传、总结文档
  • 可以联网查询总结
  • 支持 DALL-E3 绘图

目前 Alpha GPT-4 (All Tools) 只能网页登录使用,手机 app 还不支持,无法使用语音功能。

接下来,我将从文件处理、联网功能、代码运行、AI绘画、商业支持五个方面来测试使用下 Alpha GPT-4 (All Tools)。

  • 文件处理
    • 读取识别图片
    • 读取处理excel
    • 读取处理word/pdf
    • 查看压缩包内容?
  • 联网功能
    • 查明天天气,推荐穿什么
    • 查询新闻资讯
    • 查询股票
  • 代码运行
    • 运行代码测试
    • 图片生成
  • 商业支持

文件处理

常见文件处理包括:图片识别、excel/word/pdf处理等。

读取识别图片

测试: 上传一个图片,让它识别图片内容然后解需求。

成功否: 成功95%,除了标题汉字 简说Python登录系统识别成了简易Python资源系统,其他都没问题,代码和样式也不错。

测试Prompt: 根据图片上的布局,写一个前段页面,要求主题色为橙白,按钮用橙色,其他地方只要合理且好看即可。

测试结果:先给 html 代码。

再给 css 代码。

代码运行结果:

读取处理excel

测试: 上传一个 excel 做简单数据处理分析及可视化看看。

成功否: 失败。

测试Prompt: 读取csv文件内容,test.csv为关联用户数据表,表头中:totalPayAmount表示付款金额;initUserType表示是否为新用户,newUser表示新用户;realNameType表示是否认证了;gmtStart表示关联开始时间;gmtEnd表示关联结束时间,帮我统计下现在有多少个新用户关联成功,其中有多少个用户已经付款了,其他维度的你可以按你的理解帮我分析可视化下。

测试结果:

看出来了,每次上传文件他们会存在某个目录下(应该是临时或者定期清理),然后要理解文件就去代码读取文件内容,但应该不是他们服务器读取,而是在用户本地浏览器沙盒环境或者什么地方操作,有时候会出现读取错误。

读取处理word/pdf

测试: 上传一篇论文,让其总结论文内容。

成功否: 成功,但是没法统计字数。

测试Prompt: 帮我总结这篇论文内容,需要给我:论文标题、论文字数、论文核心内容概括、论文分点分析(作者提到观点、作者的解释内容概括),需要中文回复。随便找了一篇近期论文:https://arxiv.org/pdf/2311.00871.pdf

测试结果:

先是直接搜索文件结构看看有没有相关信息~

第一步没有找到,开始代码读取文件内容,然后理解分析。

查看压缩包内容?

测试: 上传一个压缩包,看看能不能查看出压缩包内容结构?(突发奇想了)

成功否: 失败了,解压显示内容与实际内容不符合。

测试Prompt: 查看这个 tar.gz 包内容,输出文件结构和各文件大小 并上传了压缩包文件。

测试结果:

按它的思路就是写代码给你解压出来,然后看看文件结构,以及每个文件大小。

首先它写了两份代码,一份解压的,一份计算文件大小的。

感觉还很惊喜,就是它的思路没啥问题,但实际显示结果与原压缩包内容是不一致的,准确来说它输出这个结果就是乱编的。

原压缩包内容:

联网功能

接下来几个应用查询都差不多,相当于查在线网站最新/近期内容,表示其直接访问提取网站内容并理解能力。

查明天天气,推荐穿什么

测试: 查明天天气,推荐穿什么

成功否: 成功

测试Prompt: 查询下今天杭州余杭区天气,我明天出门穿什么合适

测试结果:

默认会给英文回复~

转成中文~

查询新闻资讯

测试: 查询指定网站最新消息。

成功否: 标题、简介获取成功,新闻链接获取失败。

测试Prompt: 获取 https://techcrunch.com/category/artificial-intelligence/ 最新最热门的5条新闻,总结发我新闻标题、新闻简介、新闻原地址。

测试结果:

GPT4输出:

新闻网站页面显示内容:

测试结论: 完全一致,也就是 Alpha GPT-4 现在可以做简单爬虫了。

查询股票

测试: 查询指定股票涨跌情况成功否: 成功测试Prompt: 沪深300 昨日涨跌情况测试结果:

比对了下是正确的,这是2023.11.7的数据。

代码运行

运行代码测试

测试: 运行一个绘图代码,并让它用我上传的字体。成功否: 算半成功,因为沙盒环境的限制,它没法直接用我上传文件显示中文,但是图片成功绘制了出来。

测试Prompt:

代码语言:javascript复制
运行下面代码,显示结果,simhei文件我放在了上传文件里,
请将其放到合适位置,以便代码运行绘图能显示中文
# 随便绘制一个饼图
import matplotlib.pyplot as plt
import matplotlib as mpl

font_name = "simhei"
mpl.rcParams['font.family']= font_name # 指定字体
mpl.rcParams['axes.unicode_minus']=False # 正确显示负号,防止变成方框

fig1 = plt.figure()  # 先创建一个图像对象
plt.pie([0.3, 0.4, 0.3],  # 值
        labels=['简说Python', '你', '我'],  # 标签
        explode=(0, 0.2, 0),  # (爆裂)距离
        autopct='%1.1f%%',   # 显示百分数格式
        shadow=True)  # 是否显示阴影
plt.show() 

测试结果:

开始调用插件运行代码~

发现代码问题还会给你改正,然后再运行~

完成运行,确实按比例显示出了我要画的饼图,但是中文没有很好的显示,下面也给了文字解释,这可能是因为沙盒环境的限制。

测试结论: Alpha GPT-4 现在可以做一些数据分析可视化项目了。

图片生成

测试: 输入一个绘画Prompt

成功否: 成功。

测试Prompt:绘画一幅上山水画,中国风,一个老人带着斗笠,撑着船,在两座山之间的江上唱歌。

测试结果:

还有画面解释:这是对中国传统山水画的两种解读,每一种都描绘了一位戴着圆锥形帽子的长者在两座山之间的船上唱歌。这些意象体现了山水画的宁静与和谐特征。

商业支持

额,还没测试完,帐号权限就被回收了~本来还想看看写小红书文案、视频脚本啥的怎么样~

这两天chatgpt崩了还上了热搜~

努力提升自己,才是真正人生。

--END--

0 人点赞