《算法》
摇摆序列
- 当有连续递增或递减的子序列时,此时一定不是摇摆序列,只能从这个连续递增或递减的子序列中取某一个或多个值时,才能使得序列为摇摆序列,为此选择递增或递减子序列中的哪个值便成为了目标。
- 贪心策略:选择其中的什么数才能使摇摆序列最长?选择递增或递减序列的首尾元素。
移除k个数字
贪心策略:移除数组中的哪个数字才能使得剩下的字符组成的数值最小?![](https://img.haomeiwen.com/i2593286/be191594d55ac058.png)
《机器学习》
TF-IDF
-
TF-词频
图2. 词频计算示例
-
IDF-逆文档概率
图3. 逆文档概率计算示例
-
TF-IDF计算
图4. TF-IDF计算示例
朴素贝叶斯算法
- 为什么说朴素
整个形式化过程,只做最简单,最原始的假设。 -
条件概率公式
图5. 条件概率公式
上式的含义:在B发生的条件下A发生的概率,其中P(AB)为联合概率,即A和B同时发生的概率
- 全概率公式
若事件B1,B2,…构成一个完备事件组且都有正概率,则对任意一个事件A有如下公式:
![](https://img.haomeiwen.com/i2593286/e1db0ae39d7c18ec.png)
-
贝叶斯公式
由图5和图6两个公式可得,贝叶斯公式如下:
图7. 贝叶斯公式
《机器学习相关库的使用》
pandas库的使用
- pandas读取文件,将数据加载为DataFrame格式
pd.read_table()
pd.read_csv()
...... - DataFrame格式数据的常用操作
data.head() # 查看头上的元素
data.列名或data["列名"] # 获取Series,代表某一列的所有数据
data.shape # 查看data的行和列数
data["列1"] + data["列2"] # 合并两个列,并且可以给data添加新的列
data["新列名"] = 数据
data.dtypes # 查看每一列的数据类型
网友评论