自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Lestat.Z.的博客

You Know Nothing.

  • 博客(14)
  • 资源 (4)
  • 收藏
  • 关注

原创 一个pipeline的例子

记录一个pipeline的例子,代码如下#Categrical features to pass down the categorical pipeline cateforical_features = ['date', 'waterfront', 'view', 'yr_renovated']#Numerical features to pass down the numerical p...

2019-08-25 22:36:48 467

原创 记录一个自定的CategoricalTransformer

前言自定义了一个简单的字符变量的变形器,代码如下。import numpy as np import pandas as pdfrom sklearn.base import BaseEstimator, TransformerMixinfrom sklearn.preprocessing import LabelEncoder, OneHotEncoder, StandardScale...

2019-08-25 21:56:31 87

原创 自定义sklearn CustomImputer

前言自己根据需求, 自定了一个简单的CustomImputer, 代码如下import numpy as np import pandas as pdfrom sklearn.base import BaseEstimator, TransformerMixinfrom sklearn.utils.multiclass import type_of_targetfrom sklearn...

2019-08-25 14:23:47 129

原创 自定义sklearn transformer

前言自定义了一个dataframe的transformer,用来清楚无用的列, 逻辑比较简单,具体代码如下import numpy as np import pandas as pdfrom sklearn.base import BaseEstimator, TransformerMixinfrom sklearn.preprocessing import OneHotEncoder,...

2019-08-25 11:42:03 326

原创 什么是频率?

文章目录什么是频率?频率该如何度量?相对频率是如何表示的?参考资料什么是频率?频率是观察到变量(数据项)的特定值发生的次数。频率该如何度量?根据所需的目的,可以以不同的方式表示值的频率。绝对频率描述了观察到变量(数据项)的特定值发生的次数。表达频率的最简单方法是绝对值。相对频率描述了观察到变量(数据项)的特定值相对于该变量的值的总数发生的次数。通过将绝对频率除以变量的值的总数来计算相对...

2019-08-17 10:51:15 829

原创 变量有哪些类型?

根据可以研究,测量和呈现的方式,可以有不同的方式来描述变量。**数值变量(Numeric)**有将可测量的数量描述为数字的值,例如“多少”或“多少”。因此,数值变量是定量变量(quantitative)。数值变量可以进一步描述为连续或离散:连续变量(continuous) 是数字变量。观察可以在某组实数之间取任何值。给连续变量的观察值可以包括与测量仪器允许的一样小的值。连续变量的示例包括高...

2019-08-17 10:29:00 17466

原创 形状的度量Measures of Shape

什么是形状的度量?Measures of shape describe the distribution (or pattern) of the data within a dataset.The distribution shape of quantitative data can be described as there is a logical order to the values...

2019-08-17 00:08:23 236

原创 集中趋势度量Measures of Central Tendency

###什么是集中趋势度量?A measure of central tendency (also referred to as measures of centre or central location) is a summary measure that attempts to describe a whole set of data with a single value that re...

2019-08-16 23:32:58 1693

原创 数据分布度的度量Measures of Spread

什么是分布度的度量Measures of spread describe how similar or varied the set of observed values are for a particular variable (data item). Measures of spread include the range, quartiles and the interquartile...

2019-08-16 23:25:33 1093

原创 auto-sklearn中使用的一些模块

SMACSMAC是算法配置的工具。 它优化了一组实例中任意算法的参数。 这包括但不限于硬组合问题求解器的优化和各种机器学习算法的超参数优化。 主要核心包括贝叶斯优化和实例上的简单竞赛机制,以有效地决定两种配置中哪一种更好。2.ConfigSpaceConfigSpace是一个简单的python包,用于管理算法配置和超参数优化任务的配置空间。 它包括用于在配置空间描述的不同文本格式之...

2019-08-16 19:39:45 102

原创 学习一下sklearn 中的BaseEstimator

学习一下sklearn 中的BaseEstimator, 源代码如下:class BaseEstimator: """Base class for all estimators in scikit-learn Notes ----- All estimators should specify all the parameters that can be set ...

2019-08-16 15:47:16 4270 1

原创 python inspect模块

前言inspect模块提供了几个有用的函数来帮助获取有关活动对象的信息,例如模块,类,方法,函数,回溯,框架对象和代码对象。 例如,它可以用来检查类的内容,检索方法的源代码,提取和格式化函数的参数列表,或获取显示详细回溯所需的所有信息。常用方法方法名描述inspect.getmembers(object[, predicate])返回按名称排序的(名称,值)对列表中对象...

2019-08-10 20:00:24 671

原创 关于ValueError: Input contains NaN, infinity, or a value too large for dtype ('float64')”

问题描述在替换数值型字段时, 选择将空值替换为该列的平均值, 代码如下:df[col].fillna(df[col].mean(), inplace=True)然后在调用scale类转化时,还是出现了如下错误ValueError: Input contains NaN, infinity, or a value too large for dtype ('float64')”检查了一...

2019-08-07 10:13:08 522

原创 记录一个python decorator的例子

import functoolsimport loggingfrom functools import wrapsdef get_class(): return 'MAIN_CLASS"def create_logger( name = __name__): logger = logging.getLogger(name) logger.setLevel(Logging.INFO...

2019-08-05 20:55:12 46

逻辑斯蒂回归于最大熵模型笔记

此文档为阅读李航老师的统计学习法逻辑斯蒂回归于最大熵模型章节的笔记

2019-02-23

SVM支持向量机笔记

李航老师的统计学习方法的个人笔记,此文档为阅读支持向量机部分的笔记

2019-02-20

决策树_Decision_Tree学习笔记

本文档为李航老师的统计学习方法,决策树章节部分的阅读笔记

2019-02-24

统计学习方法_朴素贝叶斯笔记

李航老师的统计学习方法,朴素贝叶斯章节部分的阅读笔记

2019-02-23

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除