关于Python与SAS?
Phthon属于编程语言,如果没有代码基础,学习半年能有小成就算很不错了。Python对编程和算法的要求比较高,毕竟对算法工程师和对数据工程师的要求是不同的,学习Python可能编程会耗费掉大部分的精力,而分析师的注意力是应该放在模型、解读统计量上的,毕竟拼代码,你和程序员比是没有竞争力的。SAS不用考虑算法,只需要考虑应用环境、业务环境以及数据量级,这就足够了,会更加契合分析师的状态,接下来说说SAS吧:
SAS在统计领域可以算得上是软件之王了,做数据分析基本没有短板,要非说短板,可能有三个,一个是SAS不开源,你不知道SAS里面的算法是怎么实现的,但是你也没有必要去了解算法,决策树的算法弄得再熟悉再透彻再优化,你也没有SAS的算法工程师优化研究的透彻。第二个缺点就是SAS是单机版,项目过程中会受到单机内存的限制,可能会有瓶颈,但是第二个缺点并不影响SAS的使用,因为当前大数据的概念虽然比较火,但是使用到大数据的公司凤毛麟角,只是蹭着大数据概念的公司比较多, 谷歌百度类的公司能称得上大数据,一些零售行业、P2P行业的数据量级使用SAS就足够了,这些行业会使用SAS进行抽样处理后再进行建模,然后再使用Python去进行部署落地,并不会用全量样本去跑数据建模,全量样本去跑数据谁也跑不动,而且也会存在噪音和杂质更多的情况。第三个小缺点可能就是SAS做文本挖掘的时候不太占优势。
SAS的设计初衷就是定位于BI软件,BI软件一般都是比较庞大的,他的前端的数据获取处理以及后端的数据展现分析都是比较强大的。目前行业中学习SAS的人其实并不多,很多SAS的培训一般都转成了企业的内训,内训视频当然是不会流出的,再有就是SAS公司强大的法务能力会支撑他的版权。SAS的软件比较贵,例如EM模块一年就要小100万,他的官方培训也贵,更多针对的是分析中比较务实的问题,SAS公司不是上市公司,是一个私营公司,中国总部就在国贸那边,包了一整层楼,它全部的收入都来自他的业绩,SAS公司的收入非常稳定,会有银行、政府、保险以及通信等SAS忠实的用户会去保证SAS公司的收入,当然也只有这些公司能用得起SAS了。SAS语言属于高级语言,更接近人类的语言,基本掌握了简单的语法就能写出一些简单的代码。如果对分析软件按照难易程度进行排序的话,EXCEL和SPSS属于较低级别的图形界面,简单好操作,高些级别的软件就是即有图形界面又有编程界面的SAS,如果专注于业务方面,学习SAS EG就可以了,图形化好上手,但是EG只能够实现SAS 70%左右的功能,剩下的功能就需要你去写SAS的代码了。再高些级别的软件就是R Python这种对于女生来说比较恐怖的编程类软件了。
SAS还有一个不容小觑的优点,SAS的全模块都是通过认证的,SPSS有些算法是错的,只是错误率非常低,R只有基础包通过了认证,PYTHON只有2.7通过了认证,所以遇到统计量值不同的情况时,各路软件还是要以SAS为主的~
最后,很短的时间了解甚至掌握SAS不难,但是精通一门软件,还是需要付出很大很大努力的。
SO~ 一起加油吧
许卉 2018年12月20日 于北京
继续阅读与本文标签相同的文章
盒马创始人侯毅首次解读:盒马是什么
全面解读电商减贫 | 喜迎十九大
-
源码分析 RocketMQ DLedger(多副本) 之日志追加流程
2026-05-18栏目: 教程
-
Java描述设计模式(07):适配器模式
2026-05-18栏目: 教程
-
前端进阶|第十天 数组分组编程,区间还是连续一网打尽
2026-05-18栏目: 教程
-
深入理解Java线程状态
2026-05-18栏目: 教程
-
从SpringBoot构建十万博文聊聊限流特技
2026-05-18栏目: 教程
