Python

买彩票机选和守号哪个中奖概率高?

我有买彩票,不过就是瞎买买。早之前是随机买过一注,然后一直买这个号,不过断过一段时间没买,后来就一直是每期机选一注了。算起来也有一年多了,但目前最高奖金还是停留在5元…

于是乎就冒出了这么一个想法,机选跟守号(随意买的,没有刻意去研究彩票)哪个中奖的可能性高一些?

本着实践出真知的想法,顺便学习下拖了很久的Python网络爬虫,写了个小程序,抓取了历年大乐透/双色球的开奖数据,进行了简单的验证。

抓取彩票开奖数据

Python网络爬虫,结合pyQuery解析HTML内容,很容易就将历年开奖数据保存到本地csv文件中。

继续阅读

Python网络爬虫入门教程

本文主要介绍了如何使用Python实现基础的网络爬虫来抓取网页内容(使用 Python 2.7 的 urllib2 库)。

基本使用

使用 urllib2 模块可以轻松抓取页面的源代码。主要用到两个函数:

  • urllib2.Request(url[, data][, headers][, origin_req_host][, unverifiable])
  • urllib2.urlopen(url[, data][, timeout])

继续阅读

Python实现逻辑回归(Logistic Regression in Python)

logistic-regression-in-python

本文基于yhat上Logistic Regression in Python,作了中文翻译,并相应补充了一些内容。本文并不研究逻辑回归具体算法实现,而是使用了一些算法库,旨在帮助需要用Python来做逻辑回归的训练和预测的读者快速上手。

逻辑回归是一项可用于预测二分类结果(binary outcome)的统计技术,广泛应用于金融、医学、犯罪学和其他社会科学中。逻辑回归使用简单且非常有效,你可以在许多机器学习、应用统计的书中的前几章中找到个关于逻辑回归的介绍。逻辑回归在许多统计课程中都会用到。

我们不难找到使用R语言的高质量的逻辑回归实例,如UCLA的教程R Data Analysis Examples: Logit Regression就是一个很好的资源。Python是机器学习领域最流行的语言之一,并且已有许多Python的资源涵盖了支持向量积文本分类等话题,但少有关于逻辑回归的资料。

本文介绍了如何使用Python来完成逻辑回归。

继续阅读