2023-03-13干活小计_办公生活

2023-03-13干活小计

创始人

2024-06-02 23:59:00

08:30到达实验室 24:00左右离开

切片操作中：[]中，逗号，区分的是维度，冒号：区分的是索引，省略号… 用来代替全索引长度

rnn 文本分类终于跑完了

古诗生成：

正则表达式：

 #pattern = re.compile(r"[0123456789]") #0到9#pattern = re.compile(r"[0-9]")     #0到9#pattern = re.compile(r"[a-z]")  # a到z#pattern = re.compile(r"[A-Z]")  # A到Z#pattern = re.compile(r"[\-]")  #匹配横杠#pattern = re.compile(r"[^0-9]")    #匹配非数字 ^代表取反#pattern = re.compile(r"\d")  #所有数字 \D取反#pattern = re.compile(r"\w")  #所有汉字字母数字 下划线 \W取反#pattern = re.compile(r"\s")     #匹配空格#pattern = re.compile(r"\b\D\b")     #匹配有边界的目标词 即两边都是空格

pattern1 = re.compile(r"^python")                                          #  以什么开始
pattern2 = re.compile(r"python$")                                          # 以什么结束
result1 = pattern1.findall("python python")
result2 = pattern1.findall("python python")pattern1 = re.compile(r".ar$")  # .代表除了\n以外的任何字符
result1 = pattern1.findall("python python star")pattern1 = re.compile(r"honou?r")  #   ？可选字符 0次或1次
result1 = pattern1.findall("which is right honour or honor? or honouuur")

pattern1 = re.compile(r"\d{9}")  #   匹配九个数字
result1 = pattern1.findall("23948093285094328509432850943859")

pattern1 = re.compile(r"\d{8,9}")  #   八、九个数字 遇到九个只匹配九个
result1 = pattern1.findall("23948093285094328509432850943859")

pattern1 = re.compile(r"\d{8,9}?")  #   八、九个数字 匹配八个 非贪婪模式
result1 = pattern1.findall("23948093285094328509432850943859")

pattern1 = re.compile(r"\d{1,}?")  #   *等于{0,}0到无穷大 +等于{1,} 1到无穷大
result1 = pattern1.findall("23948093285094328509432850943859")

pattern1 = re.compile(r"^1[34578]\d{9}")  
#匹配所有电话号码 第一位1  第二位34578 后面九个0-9
result1 = pattern1.findall("15927433677")

pattern1 = re.compile(r"^http.*/$")  #   http 开头 /结尾的数据
result1 = pattern1.findall("https://mp.csdn.net/mp_blog/creation/")

进阶：

pattern1 = re.compile(r"\d{4}-\d{7}")  #   匹配下面的电话号码
result1 = pattern1.findall("张三：0731-8283333")

pattern1 = re.compile(r"(.*?)")  #   用括号将需要的内容提取出来
result1 = pattern1.findall("dhl
")

#|是或者

同门教我写的爬虫：

import json
import re
import jsonlinesimport requests
from bs4 import BeautifulSoupif __name__=="__main__":for i in range(6000):try:data=requests.get("https://www.jyznl.cn/"+str(i)+".html").textsoup=BeautifulSoup(data,'html.parser')title=soup.find('title').textprint(title)content_list=soup.findAll(name="div",attrs={"class":"entry-content u-clearfix"})results=soup.select('div[class="entry-content u-clearfix"] p')print(results)tem_dict={}tem_dict['title']=titletem_content=""tem_dict['paper_id']=ifor i,tem in enumerate(results):if(i

词库加载错误:未能找到文件“E:\highferrum_mysql\Configuration\Dict_Stopwords.txt”。

上一篇：【C++】STL简介及 string的使用

下一篇：哈佛与冯诺依曼结构

热门资讯

我喜欢你韩语怎么说 sikid...

埃菲尔铁塔在哪中国仿建埃菲尔... 2019年4月26日，广西南宁市，街头惊现一座巨型山寨版埃菲尔铁塔，高约20米，白色塔身，造型逼真，...

苗族的传统节日贵州苗族节日有... 【岜沙苗族芦笙节】岜沙，苗语叫“分送”，距从江县城7.5公里，是世界上最崇拜树木并以树为神的枪手部落...

北京的名胜古迹北京最著名的景... 北京从元代开始，逐渐走上帝国首都的道路，先是成为大辽朝五大首都之一的南京城，随着金灭辽，金代从海陵王...

应用未安装解决办法平板应用未... ---IT小技术，每天Get一个小技能！一、前言描述苹果IPad2居然不能安装怎么办？与此IPad不...

长白山自助游攻略吉林长白山游... 昨天介绍了西坡的景点详细请看链接：一个人的旅行，据说能看到长白山天池全凭运气，您的运气如何？今日介绍...

脚上的穴位图脚面经络图对应的... 人体穴位作用图解大全更清晰直观的标注了各个人体穴位的作用，包括头部穴位图、胸部穴位图、背部穴位图、胳...

demo什么意思 demo版本... 618快到了，各位的小金库大概也在准备开闸放水了吧。没有小金库的，也该向老婆撒娇卖萌服个软了，一切只...

猫咪吃了塑料袋怎么办猫咪误食... 你知道吗？塑料袋放久了会长猫哦！要说猫咪对塑料袋的喜爱程度完完全全可以媲美纸箱家里只要一有塑料袋的响...

世界上最漂亮的人世界上最漂亮... 此前在某网上，选出了全球265万颜值姣好的女性。从这些数量庞大的女性群体中，人们投票选出了心目中最美...