杨净 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI
在学校里学AI最头疼的是什么?
排第一的肯定是组里算力不够,而且是永远不够,即使春节都不够。
我一个师妹最近就向我吐槽:
找导师吵了架终于在春节前回了老家,但过年时间也得炼丹! 实验室的显卡还不够用,现在家里只有个笔记本,根本跑不动!
我去问了一圈,发现AI学子春节也要炼模型这种事,还挺普遍。
比如投国际会议的,ECCV今年截止日期是3月7日,时间很紧张。
CVPR更要命,Rebuttal截止到2月1日大年初一早上8点,大年三十晚上写论文,真·难忘今宵。
也是很辛苦了,毕竟到了除夕之夜,连琅琊榜里的言侯都不炼丹了(狗头)。
对大多数学校来说算力总是不够用的。
如果是组里的工作或导师下的Deadline,可以直接找导师报销。
但也有人是自己要卷,额外投论文、搞比赛的,那就得自掏腰包了。
有一位资深“卷王”,满世界租GPU已经租出了心得。
去大型公有云整租服务器比较贵,现在有一些面向个人的云平台就便宜多了。
个人云上可以方便的租单卡,按小时租,使用起来比较灵活。
英伟达RTX系列显卡可以做到1-2元/小时,V100大概3-4元/小时。
而且要找那种主做机器学习市场的,在国外有vast.ai,国内有矩池云、恒源云、AutoDL等。
这些平台会对AI模型训练有专门适配,框架依赖、上传数据等方面都考虑到了,不用每次上机先花半天时间配置环境。
其中叫AutoDL这家春节还准备搞大促,号称限时免费,就很离谱。
但考虑到这个平台不怎么知名,在推荐给师妹刷好感度之前,我还是自己先看看。
验证一下这羊毛到底好不好薅。
ps. 虽是羊毛,下含推荐。先划个重点,文末有惊喜!
什么样的算(yang)力(mao)平台?
看了活动细则后我坐不住了:对新注册用户来说,限时免费居然是真的。
别看这一大段抵扣券啥的说了这么多,其实就是相当于春节7天,每天送80多元余额,7天将近600。
80多元什么概念?
如果用来租英伟达RTX 3090,租满一天24小时还有富余,再添点可以租两张。
按天送搞这么复杂,大概是为了限制每个用户的用量,毕竟是拉新的活动,不能让少数人把资源都占了。
要参加这个活动的门槛也不高,首先需要是新注册用户,然后只需要充值100元即可。
这100元可以配合抵扣券在春节期间租更好的卡,或在活动结束之后正常使用。
既然真的是羊毛,那我就先薅为敬了,也考察一下这家平台还有些什么名堂。
从提供的显卡种类看,选择还是很丰富的。
其他平台基本上仅涵盖英伟达的系列显卡,从TITAN Xp、K80到3090、A100、V100等。
而AutoDL提供的显卡,包括更多RTX系列中间型号,共超过900张,还有国产芯片,寒武纪、华为之类可以选。
这些国产芯片往往更加火爆,时常处于已租完的状态。
为了避免有同学不知道该如何选GPU,除了有专门的帮助文档外,平台还将GPU分成通用性、大显存、高主频CPU、多核心CPU、1元GPU等类别供其选择。
价格上,3090每小时只需1.99元,最贵的A100 80GB NVLINK每小时也只需7.98元。包月的话也大都在每天十几二十元不等。
在此,与其他平台几类常见的显卡价格来做个比较。
(数据截止至1月26日上午11:30,图中价格显示平台最低价格,部分厂商还有充值返券机制)
所以不论种类、还是价格上,AutoDL都有一定的优势。
官网还特别强调:这些价格在今年只会降低,不会提高。
除了硬件层面,AutoDL还为深度学习用户提供配套功能。
比如,内置深度学习框架及版本的镜像,除了必备的Pytorch、Tensorflow,还有PaddlePaddle、Miniconda、清华Jittor等。
还有一些常用的开源数据和预训练模型,比如ImageNet、BERT之类,免去下载上传的烦恼。
除了该有的显卡、工具,这个平台还有一些别处没有的功能和服务。
最有意思是升降配置和实例迁移。
比如调试代码的时候可以省钱用单卡,想加速训练了随时增加。
再狠一点还可以用5毛钱的TITAN Xp调试,到时候再把实例迁移到好卡上去运行,肝Paper不浪费一分钱。
数据上传方面,一般平台就是内置JupytorLab工具、支持FileZilla、XShell等软件之类。
在这基础上,AutoDL提供了网盘服务。
可以在实例间方便的共享数据,每个地区的网盘免费空间大小为20GB。
不过这一点,也不是AutoDL特有。像矩池云、恒源云也都有免费的存储空间,超出即采取收费模式。
实在不行,平台还支持邮寄硬盘。
讲道理,一般来说只有像谷歌、亚马逊这样的大平台才会提供这个服务。
而这样一个面向学生的AutoDL不光提供还免费,同学可直接将训练数据存储在硬盘里,然后邮寄到机房,由这边运维的同学帮忙物理挂载。
对了,内蒙A区还将在明年一季度升级并接入ipv6教育专网,数据上传的速度将再次提升。
综上所述,不管在价格活动、显卡可租的范围、还在特定功能上,AutoDL确实有羊毛可薅!
薅羊毛的“最佳实践”
基本情况看完了,那这个羊毛到底怎么薅才最划算,现在就来总结一下。
首先注册就送10元券,这个也相当于余额,是无使用门槛的,可以直接抵扣。
现在注册即送1个月的三级会员,可以享受6.5折。
一个月后记得用教育邮箱认证学生身份就可轻松保持会员等级,继续享受折扣。
按会员价,春节期间一个划算的选择是英伟达A40,2.98元*24小时是71.52元,用完抵扣券还有富余。
另外3090也是不错的选择,虽然显存比A系列小,但租两张的话单精度算力几乎翻倍,可以根据任务需求选择。
8两张3090在抵扣券范围内可以用20多小时~
以上是价格层面,如果想要薅尽最后一根羊毛,其实还有一些小技巧。
上传数据、调试代码等用不到GPU的阶段可以使用无卡模式开机。
这样只会调用0.5个CPU核,2G内存,无GPU,无论租的哪种配置,无卡模式价格都是一毛一小时。
如果一开始只需要少量算力做调试,也可以先开1块GPU,等正式训练需要多卡并行了再随时升降配置。
如果是一段时间内集中的需求,可以选择包天、包周、包月。
这样比按量计费还要再便宜10%左右,而且不用担心关机后GPU被其他用户占用。
嗯,说到关机的问题,别忘了在Python代码最后加上一句执行完成后关机,避免浪费。
毕竟很多时候自己也不知道代码要执行多久。
代码语言:javascript复制os.system("shutdown")
另外提醒一下,可不要想着把羊毛薅来挖矿,是会封号的。
如果你春节也有租显卡的需求,可以点击阅读原文去注册薅起来了。
要是你刚好在准备ECCV和CVPR论文,届时文章若被录用,联系AutoDL客服,还会收到666元无门槛优惠券。
对了,还有专属读者福利!
文末留言区随意留言,截止到1月28日中午12点,点赞前20的童鞋可直接获得1000元代金券。
届时仅需提供学校邮箱即可。(代金券会发到邮箱里)
如果你本来没什么deadline要完成,要不向卷王同学一样报名个机器学习比赛去卷一卷?
毕竟优惠活动是限时的,过了春节就没了。
最后,再附上一份各GPU型号简介供参考,看看你的模型适合跑在什么卡上。
更详细的选卡攻略,可以到帮助文档查看https://www.autodl.com/docs/gpu/
— 完 —
点这里