python

python OS模块批量处理文件

2020-09-22陈海飞阅读(1869)

处理文件和文件夹的模块——os os模块是Python和操作系统进行交互的一个接口，它提供了许多操作文件及文件夹的函数。因为本书在使用Python操控Excel时，会涉及很多与文件名、文件路径、文件夹相关的操作，所以下面介绍一下os模块的基...

python数组计算的数学模块-NumPy

2020-09-22陈海飞阅读(4022)

NumPy模块的名称是由“Numerical Python”缩写而来，这个模块是一个运行速度非常快的数学模块，主要用于数组计算。下面一起来看看NumPy模块的基本用法。 1、数组的基础知识 NumPy模块的主要特点就是引入了数组的概念。因为...

python数据导入和整理模块-pandas

2020-09-22陈海飞阅读(1612)

pandas模块是基于NumPy模块的一个开源Python模块，广泛应用于完成数据快速分析、数据清洗和准备等工作，它的名字来源于“panel data”（面板数据）。pandas模块提供了非常直观的数据结构及强大的数据管理和数据处理功能，某...

python批量处理Excel文件的模块——xlwings

2020-09-22陈海飞阅读(4501)

可以处理Excel文件的Python模块有很多，如XlsxWriter、xlrd、xlwt、xlutils、openpyxl和xlwings等。下表对各个模块的功能进行了简单对比。通过上表的对比可以发现，xlwings模块的功能是最齐全的...

python报错：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’or’\u30fb’ in position

2020-09-02陈海飞阅读(1503)

网络上有很多类似的文件讲述如何解决这个问题，但是无非就是encode，decode相关的，这是导致该问题出现的真正原因吗？不是的。很多时候，我们使用了decode和encode，试遍了各种编码，utf8，utf-8,gbk,gb2312等...

Python3字符解决去除换行|空格|分列符方法

2020-09-02陈海飞阅读(6287)

在Python3的编写过程中，获取到的字符串进场存在不明原因的换行和空格，如何整合成一个单句，成为问题。方法1：使用strip()方法方法2：替换 replace(“space”,””) ...

python脚本-批量获取网页标题

2020-08-31陈海飞阅读(6448)

1、由于现在需要做的网站优化越来越多，导致偶尔有的网站出现异常情况，不能及时发现，所以才有了此脚本。 2、主要用于批量获取网站标题，运行此脚本的前提是先要获取批量监测的网址url。批量获取网页标题脚本： #coding:utf-8 #au...

wordpress 后台文章批量抓取id

2020-08-13陈海飞阅读(1454)

1、这个脚本主要是用于seo的链接提交，以及seo的主动推送，主要用于的是wordpress的网站站长。 2、这个脚本写着玩的，其实获取文章id的方法很多，最便捷的应该是通过数据库获取，此脚本涉及到一些爬虫的新知识，算是一个demo，算是一...

批量获取域名年龄

2020-08-10陈海飞阅读(1113)

对于seo来说，域名年龄是判断网站竞争力的重要指标。批量获取域名年龄脚本如下： #coding:utf-8 #author:http://www.chenhaifei.com/ import requests #打开 import tim...

批量查找百度问答浏览量

2019-08-08陈海飞阅读(1465)

需求：由于最近做了一批百度问答的词，想统计效果，由于数量较多，所以想到了用python抓取实现，以增加工作效率。通过分析分析发现，浏览量不是静态的，是通过另外一个链接获取的，如下图链接：https://zhidao.baidu.com/...

如何使用python批量修改文件内容

2019-08-02陈海飞阅读(3095)

需求：由于需要对文件进行同样的处理，如我需要将打广告的代码都删除掉，文件很多。代码如下： import os,sys path=”C:/Users/apple/Desktop/科技类文章”#这里是你的第一级文件夹的...

python报错：UnicodeDecodeError: ‘gbk’ codec can’t decode

2019-08-02陈海飞阅读(1103)

主要是编码错误修改如下图 open(a, ‘r’,encoding=’utf-8′) 主要是使用encoding=’utf-8代码将其码成utf-8。未经允许不得转载：陈海飞博...

python3 replace函数报错TypeError: a bytes-like object is required, not ‘str’

2018-06-25陈海飞阅读(11600)

我之前用的python2.7的版本，运行repalce函数没有问题，当我升级为python3.6的时候出现如下报错很明显报错信息是告诉我 replace函数执行的对象不能是str格式，需要是bytes编码类型的字符串对象。因此我将con...

Python学好了能不能找到工作？

2018-06-21陈海飞阅读(9738)

博主以自己的亲身经历举例，我是主职是做seo的，期间学习了Python，主要内容是爬虫，但是并不精通，只是够用而已，会BeautifulSoup，Reques等，这些并不够让自己应聘成为一名初级Python工程师。想要通过学习Python...

python前端、框架和其他面试题（155题）

2018-06-01陈海飞阅读(2719)

1、谈谈你对http协议的认识。 2、谈谈你对websocket协议的认识。 3、什么是magic string ？ 4、如何创建响应式布局？ 5、你曾经使用过哪些前端框架？ 6、什么是ajax请求？并使用jQuery和XMLHttpReq...

Python面试题基础篇（80题）

2018-06-01陈海飞阅读(4021)

1、为什么学习Python？ 2、通过什么途径学习的Python？ 3、Python和Java、PHP、C、C#、C++等其他语言的对比？ 4、简述解释型和编译型编程语言？ 5、Python解释器种类以及特点？ 6、位和字节的关系？ 7、b...

BeautfulSoup4最常用的5个函数【转载】

2018-05-15陈海飞阅读(3064)

1、BeautifulSoup是爬取网页信息使用频率最高的库，下面简单介绍一下我编写脚本过程中利用bs4获取信息的方法。 2、本文用到到网的某一购物场所作为例子： url=’http://www.tripadvisor.cn/A...

pip更新全部packages

2018-05-11陈海飞阅读(4057)

1、问题描述 pip可以用pip install –upgrade xxx更新指定的package，但是并没有提供一个更新全部的命令。要是有类似–upgrade all或–upgrade *这样的方式该有...

python抓取GBK网页出现乱码该怎么办？

2018-05-08陈海飞阅读(1844)

url=’http://www.chenhaifei.com/’ print url cont = requests.get(url,timeout=120,headers=headers).text.encode(...

查反链的友链脚本

2017-12-29陈海飞阅读(4870)

现在查友链的工具响应都很慢，我这个脚本的逻辑就是先将我们的友链整理出来，再直接查，有没有我们网站的字段，以确定是否挂有我们的网站，要注意的是无法确定是否带有nofllow标签，还有就是因为http响应的效率问题，不保证100%准确，可以多试...

[post+json]批量查询网站权重脚本

2017-12-29陈海飞阅读(4139)

此脚本的初衷是因为我们网站分站较多，而站长工具批量查询站点权重，无法导入，因此此脚本产生了。 #coding=utf8 import requests import re import json headers = { ‘Use...

python2.7 99乘法表

2017-12-29陈海飞阅读(8051)

python3.0 end方法就可以自由使用的，在2.7版本，需要新增from __future__ import print_function。 end=””主要是为了打印的时候不是换行，而是在后面新增空格。 fr...

python批量创建文件夹

2017-12-29陈海飞阅读(3118)

python批量创建文件夹，主要是为了批量的新建文件夹，形成序号，可以系统的管理自己的文档，增加办公的效率。 #coding:utf-8 #author:www.chenhaifei.com import os #打开 with open(...

百度批量主动推送+分文件脚本

2017-12-29陈海飞阅读(2146)

因为百度批量推送脚本的时候最大只能推送2000条，所以要有一个分文件脚本进行辅助。百度批量主动推送 #coding=utf8 import requests url = ‘http://data.zz.baidu.com/ur...

python设置环境变量【详细图解】

2017-08-07陈海飞阅读(8422)

为什么要设置环境变量？详细解释是环境变量是在操作系统中一个具有特定名字的对象，它包含了一个或者多个应用程序所将使用到的信息。例如Windows和DOS操作系统中的path环境变量，当要求系统运行一个程序而没有告诉它程序所在的完整路径时，系...

python 批量获取http状态码

2017-07-31陈海飞阅读(6025)

脚本作用：批量获取http状态码可以检测出有异常情况的页面，从而找到问题页面，寻找原因或者删除死链等。 python获取http状态码脚本如下： #coding:utf-8 #author:www.chenhaifei.com import...

python 笑话大全接口脚本

2017-07-31陈海飞阅读(3767)

今天用阿里云的时候，发现阿里云很强大，提供了很多便宜的接口，很多都是1分钱可以查询100次的（炒鸡划算），于是好奇心驱使下就写了以下的脚本，试验一番，结果当然很完美（嘚瑟ing） ####阿里云接口购买地址：https://market.a...

正则表达式 – 入门篇[转载]

2017-07-31陈海飞阅读(3522)

在线测试正则表达式 http://regexr.com/是一个提供在线版的正则式编辑、学习、创建和测试的平台，帮助编程人员快速的编写正则表达式，内置多种转义字符，点击即可添加，同时还拥有在线保存和分享的功能。 1.元字符模式描述 . 匹...

我写Python脚本时常用的调试手段

2017-07-31陈海飞阅读(2842)

1、查看运行结果异常报错(error) 遇到这种error，我都会打开百度翻译，复制某某error，查看一下是什么异常或者打开http://www.runoob.com/python/python-exceptions.html此链接，ct...

Python中列表（List）方法（基础）

2017-07-31陈海飞阅读(4666)

列表是最常用的Python数据类型，它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型。 Python列表赋值 list1 = [‘physics’, ‘chemistry̵...

Python中列表(list)常用函数方法

2017-07-31陈海飞阅读(4025)

上文Python中列表（List）方法（基础 Python列表函数函数描述实例 “”.join(list) 将list转成字符 a1=[‘a’,’b’,̵...

python批量获取百度关键词相关结果数

2017-07-31陈海飞阅读(8496)

分析关键词在百度的相关结果数有利于了解关键词在百度的竞争程度，比如一个很热门的词，那么它的相关结果数必然很高，因为大家都想做此关键词的排名，对于做SEO，这类词是不适合我们竞争的，因为这类关键词基本需求已经处于饱和状态，想要获取排名，需要...

Python如何抓取异步加载数据

2017-07-31陈海飞阅读(3976)

1、寻找异步加载的接口通过谷歌浏览器的Network查找，一般异步加载常见的有两个可能：XHR，JS。所以我们在点击进行响应时，只要观察这两项加载的内容就可以清晰的知道接口的地址。（需要注意的是：Request常用的有两种情况，1.get...

python beautifulsoup4 安装及使用案例

2017-07-31陈海飞阅读(1985)

python beautifulsoup4 安装下载beautifulsoup链接： https://pypi.python.org/pypi/beautifulsoup4（下载type为Source的文件夹）下载步骤：运行cmd，切换...

http协议请求中常见的get和post方法

2017-07-31陈海飞阅读(4377)

#为什么只单讲get和post方法？因为我最近抓取网页时发现，大部分网站最常见的就是这两种方法，这也是我为什么会研究http协议的原因。 #get和post的区别 get – 从指定的服务器中获取数据。post –...

python脚本-挖掘百度下拉框关键词

2017-07-31陈海飞阅读(2613)

注意： 1、下面的脚本直接复制无法执行，会有缩进和中英文符号的问题导致脚本无法运行。（可以通过脚本截图进行修改） 2、此脚本主要是用与批量挖掘百度下拉框词的脚本。如下图：挖掘百度下拉框关键词python脚本 #coding=utf8 i...

[转载]HTTP协议详解

2017-07-31陈海飞阅读(2355)

引言 HTTP是一个属于应用层的面向对象的协议，由于其简捷、快速的方式，适用于分布式超媒体信息系统。它于1990年提出，经过几年的使用与发展，得到不断地完善和扩展。目前在WWW中使用的是HTTP/1.0的第六版，HTTP/1.1的规范化工作...

[转载]python requests的安装与简单运用

2017-07-31陈海飞阅读(1517)

requests是python的一个HTTP客户端库，跟urllib，urllib2类似，那为什么要用requests而不用urllib2呢？官方文档中是这样说明的： python的标准库urllib2提供了大部分需要的HTTP功能，但是A...

Python中常用内置函数【实例】

2017-07-31陈海飞阅读(5490)

函数描述实例 abs() abs() 函数返回数字的绝对值。 print abs(-1);返回值为：1 divmod() divmod() 函数把除数和余数运算结果结合起来，返回一个包含商和余数的元组(a // b, a % b)。 d...