《深入浅出数据科学》的目的是帮助你掌握数学、编程和商业分析的综合技能。通过本书,你将能够自信地提出并解答复杂的数据问题,从抽象和原始的统计信息发掘并完善可执行的想法。通过将数学和计算机编程技能相结合,你将踏上成为数据科学家的激动人心的旅程。
本书介绍了数据科学的全过程,包括数据准备、数据清洗,以及如何选择有效的数据挖掘策略和技巧,从而深入理解数据科学的方方面面。你将学到数学和统计学的核心知识,以及数据科学家和分析师经常使用的代码。你将了解机器学习,学会用常见的统计学模型分析稠密数据集,创建有说服力的可视化图表,并和他人交流分析结果。
从本书你将学习到:
·理解数据科学的五个核心步骤
·聪明地使用你的数据,仔细地处理它
·填平数学和计算机编程之间的鸿沟
·学会概率论、微积分,以及使用统计模型处理数据,得出切实有效的结果
·生成并评估简单的机器学习模型
·通过分析模型有效性指标,决定机器学习模型的质量
·通过数据可视化向他人分享见解
·理解机器学习模型,并使用机器学习模型进行预测,解决自己的问题