robots.txt 是什么?

robots.txt - 维基百科

robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据(Metadata,又称元数据)。

robots.txt协议并不是一个规范,只是约定协议,并不能保护网站的隐私。

[阅读全文]

Dockerize Python Web 应用

虽然“人生苦短,我用 Python”,但是很多时候一个 Python 新手写完第一个 Web 项目之后会陷入 WSGI 是什么?接下来要干啥的蒙蔽状态中。不过好在有 Docker 这个神器,相信了解它之后,就能体验 Python + Docker 的双倍快乐并不

本文只是一个向导,基于本地编排,一步一步来实现一个 Flask 应用的容器化,想要能顺畅的阅读,至少需要了解一些 Docker 的基本知识,基本的镜像构建命令。

[阅读全文]

pipenv 快速入门

A Better Pip Workflow™

Python 开发中一般会使用 virtualenv pip 管理项目运行环境与依赖。在创建一个新项目时先使用 virtualenv 创建一个虚拟运行环境,然后使用 pip 安装依赖,最后使用 pip freeze > requirements.txt 记录项目依赖。这个过程中会遇到一些问题:

  • 版本信息没有保存
  • 升级依赖包时需要先查看requirements.txt
  • 开发环境与生产环境依赖区分

解决上述问题最直接的做法就是生成多个 requirements.txt ,比如:requirements-dev.txtrequirements-prod.txt 并记录好依赖版本信息,或者选择 Pipenv: Python Dev Workflow for Humans

[阅读全文]

在 openSUSE Tumbleweed 上使用 pyenv 管理多版本 Python 共存

pyenv does…

  • Let you change the global Python version on a per-user basis.
  • Provide support for per-project Python versions.
  • Allow you to override the Python version with an environment variable.
  • Search commands from multiple versions of Python at a time. This may be helpful to test across Python versions with tox.

pyenv 能干啥?在它的 GitHub 项目页面 就很直接的告诉你了。

[阅读全文]

Python 跨平台连接 SQL Server

前言

使用 python 访问 SQL Server 数据库,还需要支持跨平台。关于 SQL Server 的吐槽就免了,既然存在,总会有遇到这个问题的时候。

首先在 SQLAlchemy 文档中介绍的连接 SQL Server 的库就是这些了:

  • PyODBC
  • mxODBC
  • pymssql
  • zxJDBC for Jython
  • adodbapi
[阅读全文]