数据科学(Data Science)是从大数据中提取知识的研究,关键是科学。数据科学集成了多种领域的不同元素,包括信号处理,数学,概率模型技术和理论,机器学习,计算机编程,统计学,数据工程,模式识别和学习,可视化,不确定性建模,数据仓库,以及从数据中析取规律和产品的高性能计算。数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。
数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。不远的将来,数据科学家们需要精通一门、两门甚至多门学科,同时使用数学,统计学和计算机科学的生产要素展开工作。所以数据科学家就如同一个team。
曾经投资过 Facebook,LinkedIn 的格雷洛克风险投资公司把数据科学家描述成“能够管理和洞察数据的人”。在 IBM 的网站上,数据科学家的角色被形容成“一半分析师,一半艺术家”。他们代表了商业或数据分析这个角色的一个进化。
由前纽约证券交易所数据科学家 Ken 创建了一个数据科学家微信群,不管你是在校学生还是从事数据科学工作者一个相互学习,交流,资源分享的平台。也欢迎数据工程师 Data Engineer