常用代码块
if __name__ == '__main__' :
#!/usr/bin/env python
# -*- coding: utf-8 -*-
def main():
print('hello world')
if __name__ == '__main__':
main()
#!/usr/bin/env python
# -*- coding: utf-8 -*-
def main():
print('hello world')
if __name__ == '__main__':
main()
tkinter经典面向对象写法
from tkinter import messagebox
class Application ( Frame ) :
def __init__ ( self,master=None ) :
self. btn01 = Button ( self )
self. btn01 [ "text" ] = "点我"
self. btn01 [ "command" ] = self. btnCmd
messagebox. showinfo ( '标题' , '显示内容' )
if __name__ == '__main__' :
root. geometry ( "400x100+200+300" )
root. title ( "www.code8cn.com" )
app = Application ( master=root )
from tkinter import *
from tkinter import messagebox
class Application(Frame):
def __init__(self,master=None):
super().__init__(master)
self.master = master
self.pack()
self.createWidget()
def createWidget(self):
self.btn01 = Button(self)
self.btn01["text"] = "点我"
self.btn01.pack()
self.btn01["command"] = self.btnCmd
def btnCmd(self):
messagebox.showinfo('标题','显示内容')
if __name__ == '__main__':
root = Tk()
root.geometry("400x100+200+300")
root.title("www.code8cn.com")
app = Application(master=root)
root.mainloop()
from tkinter import *
from tkinter import messagebox
class Application(Frame):
def __init__(self,master=None):
super().__init__(master)
self.master = master
self.pack()
self.createWidget()
def createWidget(self):
self.btn01 = Button(self)
self.btn01["text"] = "点我"
self.btn01.pack()
self.btn01["command"] = self.btnCmd
def btnCmd(self):
messagebox.showinfo('标题','显示内容')
if __name__ == '__main__':
root = Tk()
root.geometry("400x100+200+300")
root.title("www.code8cn.com")
app = Application(master=root)
root.mainloop()
一、请求接口(短链接)
1、requests
requests库的七个主要方法
方法 解释 requests.request() 构造一个请求,支持以下各种方法 requests.get() 获取html的主要方法 requests.head() 获取html头部信息的主要方法 requests.post() 向html网页提交post请求的方法 requests.put() 向html网页提交put请求的方法 requests.patch() 向html提交局部修改的请求 requests.delete() 向html提交删除请求
详解: https://blog.csdn.net/pittpakk/article/details/81218566
最常用的就是 get \post,传递json参数
import requests #导入requests库
r=requests. get ( url,params,**kwargs ) #get请求目标url
r = requests. post ( url, data ) # post推送目标url
response= [ requests. post ( url = url, data=params ) . json #一般接口返回需要json化,方便解析数据
print ( response. status_code ) #输出http请求的返回状态,若为200则表示请求成功
print ( response ) #输出结果,查看返回数据结构
import requests #导入requests库
r=requests.get(url,params,**kwargs) #get请求目标url
r = requests.post(url, data) # post推送目标url
#获取xx接口数据
def get_data():
#确认请求链接
url ="http://test"
#构建参数
params={
"参数名a": "参数值a",
"参数名b": "参数值b"
}
response=[requests.post(url = url, data=params).json #一般接口返回需要json化,方便解析数据
print(response.status_code) #输出http请求的返回状态,若为200则表示请求成功
print(response)#输出结果,查看返回数据结构
import requests #导入requests库
r=requests.get(url,params,**kwargs) #get请求目标url
r = requests.post(url, data) # post推送目标url
#获取xx接口数据
def get_data():
#确认请求链接
url ="http://test"
#构建参数
params={
"参数名a": "参数值a",
"参数名b": "参数值b"
}
response=[requests.post(url = url, data=params).json #一般接口返回需要json化,方便解析数据
print(response.status_code) #输出http请求的返回状态,若为200则表示请求成功
print(response)#输出结果,查看返回数据结构
二、链接数据库
1、pymysql
常用的mysql数据库,可以直接使用pymysql组件,链接数据库进行简单的增删改查操作。
db = pymysql. connect ( host= 'test.mysql.com' ,
print ( '连接数据库错误,错误是%s' % e )
# 使用 cursor() 方法创建一个游标对象 cursor
# 使用 execute() 方法执行 SQL 查询
key = 'update,UPDATE,delete,DELETE,insert,INSERT'
if any ( k in sql and k for k in key. split ( ',' )) :
print ( '执行sql语句失败,错误是%s' % e )
data1 = cursor. fetchone () # 使用 fetchone() 方法获取一条数据.
data2 = cursor. fetchmany ( 2 ) # 使用 fetchmany(x) 方法获取 x 条数据.
data3 = cursor. fetchall () # 使用fetchall() 方法获取所有的数据
#导入第三方资源包
import pymysql
#进行数据库操作
def Con_Data(sql):
# 进行数据库连接
try:
db = pymysql.connect(host='test.mysql.com',
port='端口号',
user='账号',
passwd='密码',
charset='utf8',
db='数据库名',
connect_timeout=6)
except Exception as e:
print('连接数据库错误,错误是%s' % e)
# 使用 cursor() 方法创建一个游标对象 cursor
cursor = db.cursor()
# 使用 execute() 方法执行 SQL 查询
try:
cursor.execute(sql)
#简单判断,是进行什么操作
if 'SELECT' in sql:
pass
key = 'update,UPDATE,delete,DELETE,insert,INSERT'
#如果是增删改操作
if any(k in sql and k for k in key.split(',')):
#进行提交
db.commit()
except Exception as e:
db.rollback()# 发生错误时回滚
print('执行sql语句失败,错误是%s' % e)
#根据需要选择
data1 = cursor.fetchone()# 使用 fetchone() 方法获取一条数据.
data2 = cursor.fetchmany(2) # 使用 fetchmany(x) 方法获取 x 条数据.
data3 = cursor.fetchall() # 使用fetchall() 方法获取所有的数据
# 关闭游标
cursor.close()
# 关闭数据库连接
db.close()
return data
#导入第三方资源包
import pymysql
#进行数据库操作
def Con_Data(sql):
# 进行数据库连接
try:
db = pymysql.connect(host='test.mysql.com',
port='端口号',
user='账号',
passwd='密码',
charset='utf8',
db='数据库名',
connect_timeout=6)
except Exception as e:
print('连接数据库错误,错误是%s' % e)
# 使用 cursor() 方法创建一个游标对象 cursor
cursor = db.cursor()
# 使用 execute() 方法执行 SQL 查询
try:
cursor.execute(sql)
#简单判断,是进行什么操作
if 'SELECT' in sql:
pass
key = 'update,UPDATE,delete,DELETE,insert,INSERT'
#如果是增删改操作
if any(k in sql and k for k in key.split(',')):
#进行提交
db.commit()
except Exception as e:
db.rollback()# 发生错误时回滚
print('执行sql语句失败,错误是%s' % e)
#根据需要选择
data1 = cursor.fetchone()# 使用 fetchone() 方法获取一条数据.
data2 = cursor.fetchmany(2) # 使用 fetchmany(x) 方法获取 x 条数据.
data3 = cursor.fetchall() # 使用fetchall() 方法获取所有的数据
# 关闭游标
cursor.close()
# 关闭数据库连接
db.close()
return data
三、线程 threading
创建、撤消与切换进程,存在较大的时空开销,所以引入线程 一个程序至少一个进程,一个进程至少一个线程 Python中使用线程有两种方式:函数或者用类来包装线程对象。 进程是资源分配的最小单位,线程是程序的最小执行单位 多线程类似于同时执行多个不同程序,多线程运行有如下优点:
程序进程速度可能加快(多线程不一定更快,参考链接:https://blog.csdn.net/weixin_42176112/article/details/117790945); 可以大量创建线程 线程与线程之间是独立的,并发执行。有好处,在收发数据时;坏处,在赋值时,容易发生错位赋值。 线程主要针对于具有大量输入、输出以及网络收发数据等限制程序的速度时
thread = threading. Thread ( target= '' '方法名' '' , args= [ '' '方法参数' '' ])
thread_list. append ( thread )
for Start_th in thread_list:
for Stop_th in thread_list:
#线程
'''
num:int #启用线程数,参考电脑cpu
'''
def ThreadRun(num):
thread_list = []
# 创建线程
for i in range(num):
thread = threading.Thread(target= '''方法名''' , args=[ '''方法参数''' ])
thread_list.append(thread)
# 启用线程
for Start_th in thread_list:
Start_th.start()
time.sleep(0.01)
# 停用线程
for Stop_th in thread_list:
Stop_th.join()
#线程
'''
num:int #启用线程数,参考电脑cpu
'''
def ThreadRun(num):
thread_list = []
# 创建线程
for i in range(num):
thread = threading.Thread(target= '''方法名''' , args=[ '''方法参数''' ])
thread_list.append(thread)
# 启用线程
for Start_th in thread_list:
Start_th.start()
time.sleep(0.01)
# 停用线程
for Stop_th in thread_list:
Stop_th.join()
为避免多线程同时修改同一数值,此时可以采取加锁的方式
threadLock = threading. Lock () #锁对象实例化
threadLock. acquire () #获得锁
threadingLock. release #释放锁
threadLock = threading.Lock() #锁对象实例化
threadLock.acquire() #获得锁
'''
此处进行相关数据操作
同一时间只有一个线程再此处执行
'''
threadingLock.release #释放锁
threadLock = threading.Lock() #锁对象实例化
threadLock.acquire() #获得锁
'''
此处进行相关数据操作
同一时间只有一个线程再此处执行
'''
threadingLock.release #释放锁
四、协程gevent
gevent是python的一个并发框架,以微线程greenlet为核心,使用了epoll事件监听机制以及诸多其他优化而变得高效。 而且其中有个monkey类,将现有基于Python线程直接转化为greenlet(类似于打patch)。
在运行时的具体流程大概就是:
当一个greenlet遇到IO操作时,比如访问网络/睡眠等待,就自动切换到其他的greenlet, 等到IO操作完成,再在适当的时候切换回来继续执行。
由于IO操作非常耗时,经常使程序处于等待状态,有了gevent为我们自动切换协程,就保证总有greenlet在运行,而不是等待IO。同时也因为只有一个线程在执行,会极大的减少上下文切换的成本
from gevent import monkey;monkey. patch_all () # 给所有的耗时操作打上补丁 , 在脚本开头导入时声明
print ( name,nn, i,time. time ())
shui ( 5 ) # 协程遇到耗时操作后会自动切换其他协程运行
print ( name, '>>>>>>' , i,time. time ())
l = task_1 #创建 <class 'function'> 的变量
if __name__ == "__main__" :
gevent. joinall ([ # 等到协程运行完毕
gevent. spawn ( l, "task_1" , "-----" ) , # 创建协程,带参数
gevent. spawn ( task_2, "task_2" ) # 创建协程,不带参数
#gevent monkey
from gevent import monkey;monkey.patch_all()# 给所有的耗时操作打上补丁 , 在脚本开头导入时声明
import gevent
import time
def shui(n):
time.sleep(n)
def task_1(name,nn):
for i in range(10):
print(name,nn, i,time.time())
shui(5) # 协程遇到耗时操作后会自动切换其他协程运行
def task_2(name):
for i in range(10):
print(name,'>>>>>>', i,time.time())
shui(3)
l = task_1 #创建 <class 'function'> 的变量
if __name__ == "__main__":
gevent.joinall([ # 等到协程运行完毕
gevent.spawn(l, "task_1","-----"), # 创建协程,带参数
gevent.spawn(task_2, "task_2")# 创建协程,不带参数
])
#gevent monkey
from gevent import monkey;monkey.patch_all()# 给所有的耗时操作打上补丁 , 在脚本开头导入时声明
import gevent
import time
def shui(n):
time.sleep(n)
def task_1(name,nn):
for i in range(10):
print(name,nn, i,time.time())
shui(5) # 协程遇到耗时操作后会自动切换其他协程运行
def task_2(name):
for i in range(10):
print(name,'>>>>>>', i,time.time())
shui(3)
l = task_1 #创建 <class 'function'> 的变量
if __name__ == "__main__":
gevent.joinall([ # 等到协程运行完毕
gevent.spawn(l, "task_1","-----"), # 创建协程,带参数
gevent.spawn(task_2, "task_2")# 创建协程,不带参数
])
上面可见,gevent.joinall()方法,以字典的形式去进行切换, 如果需要执行的方法较多,或者想要多次执行同一方法,就不太方便。 我们可以直接将创建协程存入字典,就方便重复调用一个方法(并发、压测) 得到以下代码
if __name__ == "__main__" :
for i in range ( 100 ) : #添加协程数
threads. append ( gevent. spawn ( l, "name" , i ))
print ( "the main thread!" )
if __name__ == "__main__":
threads = []
for i in range(100):#添加协程数
threads.append( gevent.spawn(l, "name", i))
gevent.joinall(threads)
print("the main thread!")
])
if __name__ == "__main__":
threads = []
for i in range(100):#添加协程数
threads.append( gevent.spawn(l, "name", i))
gevent.joinall(threads)
print("the main thread!")
])
Python常用的基本编程规范
1、在文件开头声明文件编码,以下两种均可
# -*- coding: utf-8 -*-
# coding = utf-8
# -*- coding: utf-8 -*-
# coding = utf-8
2、缩进规则 统一使用 4 个空格进行缩进,不要用tab, 更不要tab和空格混用
3、注释部分,# 号后面要空一格
# 注释部分
4、空行 双空行:编码格式声明、模块导入、常量和全局变量声明、顶级定义(类的定义)和执行代码之间空两行 单空行:方法定义之间空一行,方法内分隔某些功能的位置也可以空一行
5、模块导入部分 导入应该放在文件顶部,位于模块注释和文档字符串之后,模块全局变量和常量之前。 导入应该照从最通用到最不通用的顺序分组,分组之间空一行,依次为:标准库导入-》第三方库导入-》应用程序指定导入 每个 import 语句只导入一个模块,尽量避免一次导入多个模块
6、Python命名建议遵循的一般性原则: 模块尽量使用小写命名,首字母保持小写,尽量不要用下划线 类名使用驼峰(CamelCase)命名风格,首字母大写,私有类可用一个下划线开头 函数名、变量名一律小写,如有多个单词,用下划线隔开,私有函数用一个下划线开头 常量采用全大写,如有多个单词,使用下划线隔开
7、引号 输出语句中使用单双引号都是可以正确的,此外 正则表达式推荐使用双引号、文档字符串 (docstring) 推荐使用三个双引号
1.用户代理 User Agent 在浏览器地址栏输入:about:version
Mozilla/ 5.0 ( Windows NT 10.0 ; Win64; x64 ) AppleWebKit/ 537.36 ( KHTML, like Gecko ) Chrome/ 105.0 . 0 . 0 Safari/ 537.36
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36
2.文件读写
if not os. path . exists ( path ) :
with open ( file_path, "w" , encoding= 'utf8' ) as f:
with open ( r 'c:/path/to/file' , 'r' ) as f:
if not os.path.exists(path):
os.makedirs(path)
with open(file_path, "w", encoding='utf8') as f:
f.write("")
with open(r'c:/path/to/file', 'r') as f:
print(f.read())
if not os.path.exists(path):
os.makedirs(path)
with open(file_path, "w", encoding='utf8') as f:
f.write("")
with open(r'c:/path/to/file', 'r') as f:
print(f.read())
3.基本爬虫正则
body = re. compile ( r '<body.*</body>' , re. S ) . findall ( r. text )[ 0 ]
ret = re. sub ( r '[0-9]' , "*" , s )
res = requests.get(url)
res.encoding = 'utf8'
body = re.compile(r'<body.*</body>', re.S).findall(r.text)[0]
ret = re.sub(r'[0-9]', "*", s)
res = requests.get(url)
res.encoding = 'utf8'
body = re.compile(r'<body.*</body>', re.S).findall(r.text)[0]
ret = re.sub(r'[0-9]', "*", s)
4.python打开文件w和wb,r和rb的区别
w表示正常写入 wb表示二进制写入
r表示正常读取 rb表示二进制读取
5.python常用函数
string = "www.code8cn.com"
print ( string. split ( '.' )[ -1 ]) # -1代表倒数第1个
print ( string. split ( '.' )[ 1 : ]) # 1:代表从第二个往后
ret:random six num and letter
num = random. randint ( 0 , 9 )
# num = chr(random.randint(48,57))#ASCII表示数字
letter = chr ( random. randint ( 97 , 122 )) # 取小写字母
Letter = chr ( random. randint ( 65 , 90 )) # 取大写字母
s = str ( random. choice ([ num, letter, Letter ]))
pic_name = hashlib. md5 ( b '123' ) . hexdigest ()
# 通过指定分隔符对字符串进行切片
string = "www.code8cn.com"
print(string.split('.')[-1]) # -1代表倒数第1个
print(string.split('.')[1:]) # 1:代表从第二个往后
# 得到6位随机数
def v_code(n=6):
"""
Returns:
ret:random six num and letter
"""
ret = ""
for i in range(n):
num = random.randint(0, 9)
# num = chr(random.randint(48,57))#ASCII表示数字
letter = chr(random.randint(97, 122)) # 取小写字母
Letter = chr(random.randint(65, 90)) # 取大写字母
s = str(random.choice([num, letter, Letter]))
ret += s
return ret
pic_name = hashlib.md5(b'123').hexdigest()
# 通过指定分隔符对字符串进行切片
string = "www.code8cn.com"
print(string.split('.')[-1]) # -1代表倒数第1个
print(string.split('.')[1:]) # 1:代表从第二个往后
# 得到6位随机数
def v_code(n=6):
"""
Returns:
ret:random six num and letter
"""
ret = ""
for i in range(n):
num = random.randint(0, 9)
# num = chr(random.randint(48,57))#ASCII表示数字
letter = chr(random.randint(97, 122)) # 取小写字母
Letter = chr(random.randint(65, 90)) # 取大写字母
s = str(random.choice([num, letter, Letter]))
ret += s
return ret
pic_name = hashlib.md5(b'123').hexdigest()
6.爬虫常用代码
'query' : 'site:code8cn.com' # getHtmlStr('https://sogou.com/web')
"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36"
#res = requests.get(url=url,params=params,headers=headers)
res = requests. get ( url=url,headers=headers )
# request.get封装
def getHtmlStr(url):
params = {
'query':'site:code8cn.com' # getHtmlStr('https://sogou.com/web')
}
headers ={
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36"
}
#res = requests.get(url=url,params=params,headers=headers)
res = requests.get(url=url,headers=headers)
res.encoding = 'utf8'
return res.text
# request.get封装
def getHtmlStr(url):
params = {
'query':'site:code8cn.com' # getHtmlStr('https://sogou.com/web')
}
headers ={
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.36"
}
#res = requests.get(url=url,params=params,headers=headers)
res = requests.get(url=url,headers=headers)
res.encoding = 'utf8'
return res.text