Python

How to write shortest code with Python

I was so enthralled by the Codefights Challenges of writing shortest code last weekend. After several attempts, I finally managed to rank #1 in this MatchingParentheses problem with one-line solution of only 77 chars(excludes whitespace). Curtailing chars of solution is fun with little tricks. In the following I will show the tricks I used in this problem. Problem Description: Given a string para, consisting of symbols '(', '[', '{', ')', ']', '}' and ' ', find out if it is a correct bracket sequence (CBS in short) with occasional whitespace (' ') characters.

Python代码风格指南(三)命名约定(PEP8中文翻译)

命名约定(Naming Conventions)

Python标准库的命名约定有一些混乱,因此我们永远都无法保持一致。但如今仍然存在一些推荐的命名标准。新的模块和包(包括第三方框架)应该采用这些标准,但若是已经存在的包有另一套风格的话,还是应当与原有的风格保持内部一致。

重写原则(Overriding Principle)

对于用户可见的公共部分API,其命名应当表达出功能用途而不是其具体的实现细节。

描述性:命名风格(Descriptive: Naming Styles)

存在很多不同的命名风格,最好能够独立地从命名对象的用途认出采用了哪种命名风格。

以下是常用于区分的命名风格:

Python代码风格指南(二)字符串引用、空格、注释和版本注记(PEP8中文翻译)

字符串引用(String Quotes)

在Python中表示字符串时,不管用单引号还是双引号都是一样的。但是不推荐将这两种方式看作一样并且混用。最好选择一种规则并坚持使用。当字符串中包含单引号时,采用双引号来表示字符串,反之也是一样,这样可以避免使用反斜杠,代码也更易读。

对于三引号表示的字符串,使用双引号字符来表示(译注:即用"""而不是'''),这样可以和PEP 257的文档字符串(docstring)规则保持一致。

表达式和语句中的空格(Whitespace in Expressions and Statements)

Python代码风格指南(一)代码设计(PEP8中文翻译)

翻译自:PEP 8 - Style Guide for Python Code

介绍(Introduction)

这篇文档说明了Python主要发行版中标准库代码所遵守的规范。请参考实现Python的C代码风格指南信息PEP。

这篇文档和PEP 257(Docstring Conventions)都改编自Guido(译注:Python之父)最早的Python风格指南文章,并加入了Barry风格指南里的内容。

语言自身在发生着改变,随着新的规范的出现和旧规范的过时,代码风格也会随着时间演变。

很多项目都有自己的一套风格指南。若和本指南有任何冲突,应该优先考虑其项目相关的那套指南。

python numpy 计算自相关系数

在分析时间序列时,通常需要计算一个序列的自相关系数。自相关(Autocorrelation)又叫做序列相关,通常采用自相关系数来发现序列的重复规律,周期等信息。

我们有序列$X:x_1,x_2,x_3,…,x_n$,设$X_{s,t}$为$s$时刻开始,$t$时刻结束的序列:$x_s,x_{s+1}…,x_{t-1},x_t$。$\mu_{s,t}$为序列$X_{s,t}$的均值,$\sigma_{s,t}$为序列$X_{s,t}$的标准差。那么一阶自相关系数为:

Scikit-Learn机器学习介绍(中文翻译)

翻译自:http://scikit-learn.org/stable/tutorial/basic/tutorial.html

以后可能会根据自己的学习慢慢翻译其他的章节,水平有限,不足之处请指正。

本章内容 在本章中,我们会介绍在使用scikit-learn中遇到的[机器学习]1术语,以及一个简单的机器学习例子。

机器学习:问题设定


一般来说,机器学习问题可以这样来理解:我们有n个[样本]2的数据集,想要预测未知数据的属性。