Linear Algebra
线性代数、统计学中有很多概念作为机器学习中的基础,比如说矩阵运算、相关系数等。ML 中的一个难点就是由原来概率中的线性变换直接过渡到了矩阵和网络,这其中的过程却没有人铺垫。于是,本文持续更新和 ML 相关的线性代数、统计学知识和相关的实现。
线性代数、统计学中有很多概念作为机器学习中的基础,比如说矩阵运算、相关系数等。ML 中的一个难点就是由原来概率中的线性变换直接过渡到了矩阵和网络,这其中的过程却没有人铺垫。于是,本文持续更新和 ML 相关的线性代数、统计学知识和相关的实现。
主要介绍 fastText、faiss 两个常用的工具,然后顺带介绍一下容易混淆的概念 k-means 和knn。
主要介绍机器学习中的数据预处理(这里主要讲的是数值型数据的预处理,而非中文数据预处理),包括 data cleaning、data integration、 data transformation、data reduction、data imbalanced 和一些概念。 data normalization 是经常用到的。
题目都是来自牛客网在线刷题中的剑指offer。刷题记录,顺便从考察知识点的角度分类整理。主要分成以下四大类:
python中处理路径问题,详解 os包下的path 模块。
刷题笔记,主题是树,以LeetCode上的题目为例。树相关的题目大多使用到递归的思想, 尤其是在深度优先遍历中;还有一类遍历方式:宽度优先遍历,使用队列来实现。
介绍linux 中常见的命令 和github 中常用的命令
LeetCode 刷题总结(二), 使用Python 实现。该篇题目类型主要是: list, linkedList 还有简单的 tree。
LeetCode 刷题总结(一), 使用Python 实现。该篇题目类型主要是: array 和string 的相关处理。