# yyds干货盘点 # 求助大佬,我想索引‘PN’这一列为啥不行呢?

# yyds干货盘点 # 求助大佬,我想索引‘PN’这一列为啥不行呢?

大家好,我是皮皮。一、前言前几天在Python白银交流群【笑】问了一个​​pandas​​处理的问题,这里拿出来给大家分享下。下图是代码和报错截图:原始数据如下图所示:二、实现过程这里在控制台中输出的结果如下图所示:【瑜亮老师】给了一个思路,如下所示:后来发现还真是空格导致的问题,只需要增加空格在里边,即可顺利的读取出来。顺利地解决了粉丝的问题。三、总结大家好,我是皮皮。这篇文章主要盘点了一个​​
用户头像
网络安全华佗 lv.1
0 0 0 2023-02-01
python简单爬虫示例

python简单爬虫示例

网页爬虫其实是一件很有意思的事情,对于我之前写过的爬虫,主要都是用urllib2、BeautifulSoup实现快速简单的爬虫代码,scrapy也偶尔写过。最近因为像提升自己的爬虫水平,就顺便做个爬虫学习记录。一、正则表达式正则表达式是一个很强大的工具了,众多的语法规则,我在爬虫中常用的有:(图1)常用的方法有:find_all(),search(),sub()二、urllib和urllib2ur
用户头像
情报中心 lv.1
0 0 0 2023-02-01
2023美国大学生数学建模竞赛思路和资料

2023美国大学生数学建模竞赛思路和资料

1 赛题思路(赛题出来以后第一时间分享)2023年美赛比赛日期和时间报名截止日期:美国东部时间2023 年2月16日星期四下午 3:00前。(北京时间2023年2月17日凌晨4点)比赛开始:美国东部时间 2023 年 2 月 16 日星期四下午 5:00。(北京时间2023年2月17日早上6点)比赛结束:美国东部时间 2023 年 2 月 20 日星期一晚上 8:00。(北京时间2023年2月21
用户头像
Tempo lv.1
0 0 0 2023-02-01
Python 爬虫爬不到内容如何检查网页解析情况?

Python 爬虫爬不到内容如何检查网页解析情况?

1、扒取网页和基本代码:import urllibresponse = urllib2.urlopen("http://www.baidu.com") print response.read()response = urllib2.urlopen("http://www.baidu.com")print response.read()首先我们调用的是 urllib2 库里面的 urlopen 方法
用户头像
尼古拉夫斯7 lv.1
0 0 0 2023-02-01
蓝桥杯备战日志(Python)2-相乘(逆向枚举)

蓝桥杯备战日志(Python)2-相乘(逆向枚举)

原题 小蓝发现,他将  至  之间的不同的数与  相乘后再求除以  的余数,会得到不同的数。 小蓝想知道,能不能在  至  之间找到一个数,与  相乘后 再除以  后的余数为 。如果存在,请在答案中提交这个数; 如果不存
用户头像
wander lv.2
0 0 0 2023-01-30
常见的6个Python数据可视化库!

常见的6个Python数据可视化库!

  提到数据可视化库,相信大家对这个都不陌生,而且Python中内置了很多数据可视化库,是我们工作的好帮手。本文为大家介绍一下常见的6个Python数据可视化库,希望对你们有帮助。  1、Matplotlib  Matplotlib是Python中众多数据可视化库的鼻祖,其设计风格与20世纪80年代设计的商业化程序语言MATLAB十分接近,具有很多强大且复杂的可视化功能。Matplotlib包含多
用户头像
paranoid lv.1
0 0 0 2023-01-30
Python工具箱系列(二十四)

Python工具箱系列(二十四)

不管多少人黑微软,微软出品的大多数产品都能够深入人心,成为精品。在数据库领域,微软为专业人士提供SQL Server(简称mssql)。为日常办公人士提供Access与Excel这两款数据存储与分析的神器。 SQL Server是微软在数据库领域打造的旗舰产品,使用起来安全、稳定、可靠,并且对于SQL语言的语法与特性支持的非常好。长期以来由于微软敌视开源运动,所以SQL Server只能
用户头像
落寞瓜子壳 lv.3
0 0 0 2023-01-30
实现单线程多并发的几种方式

实现单线程多并发的几种方式

单线程爬虫适用于小规模爬虫项目,如果应对大型项目就得实现多线程多并发,那么单线程如何实现多并发,下面几个示例可以一起看看。 1、asyncio 2、gevent 3、Twisted 4、Tornado 下面分别是这四种代码的实现例子: asyncio例子1: import asyncio@asyncio.coroutine #通过这个装饰器装饰def func1(): pr
用户头像
村上春种树 lv.2
0 0 0 2023-01-30
提升爬虫性能的几种方法

提升爬虫性能的几种方法

爬虫现如今在各行各业中都发挥着重要的作用,对于获取海量公开信息,那么如何才能提高效率。 下面我们通过请求网页例子来一步步理解如何提升爬虫性能。 当我们有一个列表存放了一些url需要我们获取相关数据,我们首先想到的是循环 简单的循环串行 这一种方法相对来说是最慢的,因为一个一个循环,耗时是最长的,是所有的时间总和。 代码如下: import requestsurl_list = [
用户头像
sadness安全宇航员 lv.1
0 0 0 2023-01-30
蓝桥杯备战日志(Python)1-卡片&直线(普通填空)

蓝桥杯备战日志(Python)1-卡片&直线(普通填空)

1.卡片 1.1原题   1.2分析       题意抽象:现有10种数字卡片0~9,每种卡片有2021个,使用这些数字组成新的数字1,2,3,4,...,n,即从1开始,每次加1,直到所需卡片数量不足。在现有的20210个数字卡片下,n的最大值为多少? 由题意可知,在不断拼新的数时,数字1是最先使用的数字,且一定是使用最多的数字,因为
用户头像
sanyue科研 lv.1
0 0 0 2023-01-30
爬虫Robots协议的规定

爬虫Robots协议的规定

robots(也称为爬虫协议、机器人协议等)称是“网络爬虫排除标准”是网站跟爬虫间的一种协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。 当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问
用户头像
一位美女 lv.1
0 0 0 2023-01-30
Python爬虫实践代码示例

Python爬虫实践代码示例

对于刚入门爬虫的小伙伴来说,累积经验多练习代码是非常有必要的,下面就是有关爬虫的一些小案例,欢迎大家指正。 import requestsfrom bs4 import BeautifulSoup# import pandasdef GetBlogByPage(pageNum): headers={ "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WO
用户头像
落寞瓜子壳 lv.3
0 0 0 2023-01-30
场景编程集锦 - 世界那么大,我想去看看

场景编程集锦 - 世界那么大,我想去看看

场景描述   “世界那么大,我想去看看”。这句话出自于一位中学老师的辞职申请,整个辞职信只有短短10个字,它被喻为史上最具情怀的辞职信。如此任性的辞职信,领导最后真批准了。随着辞职信内容爆光,“世界那么大,我想去看看”迅速爆红网络,形成现象级传播,引发无数网友共鸣和传颂。或许人生就是为了领略更多的精彩,在中国古时候就有读万卷书,不如行万里路的名言,明代旅行家徐霞客更是穷尽一生,游历华夏大好河
用户头像
网络安全芝麻鱼 lv.1
0 0 0 2023-01-17
一个并发编程中线程同步和同步锁的问题

一个并发编程中线程同步和同步锁的问题

(一个并发编程中线程同步和同步锁的问题) 1. 线程安全问题 经典问题——银行取钱问题里面的核心问题 (1)用户输入账户、密码并判断 (2)输入取款金额 (3)判断余额与取款金额孰多孰少 (4)如果余额大于取款金额则取款成功;否则失败 若是代码如下: import threading import time class Account: #
用户头像
在安全路上的白白 lv.1
0 0 0 2023-01-17
Git服务器搭建与Jenkins交互下代码

Git服务器搭建与Jenkins交互下代码

​今天在测试jenkins 拉代码的时候,又出现一些权限和交互的问题,今天再总结一下​: 一,Git服务器的配置根据这里的指导直接操作 ​​https://www.runoob.com/git/git-server.html​​ ​ 特别要注意里面git账号和文件的权限,ssh文件的权限(全部按照这里说的操作)​ 二,Jenkins服务器配置​   记住在使用J
用户头像
网络安全芝麻鱼 lv.1
0 0 0 2023-01-17
一个爬取图片的小脚本

一个爬取图片的小脚本

#!/usr/bin/python3import requestsimport osfrom lxml import etreeif __name__ == '__main__': url = "http://pic.netbian.com/4kmeinv/index.html" headers = { "User-Agent":"Mozilla/5.0 (Windows
用户头像
web小门神 lv.1
0 0 0 2023-01-14
新手如何完成python视频爬虫

新手如何完成python视频爬虫

作为新手小白学习爬虫,重要的就是实战经验,爬虫语言有多种,今天我们就通过python语言来做爬虫视频,下面的代码值得大家借鉴参考。 # coding=utf-8import jsonimport os.pathimport pprintimport requestsdef get_page(pcursor): path = 'video/' if not os.path.exists
用户头像
落寞瓜子壳 lv.3
0 0 0 2023-01-14
python爬虫之抓取彼岸壁纸

python爬虫之抓取彼岸壁纸

喜欢壁纸的小伙伴经常苦恼于不能找到高清壁纸,网络上手动搜索费时费力,而且格式大小不适合电脑还会失真。那么我们该如何通过python爬虫实现高效快速爬取高清图片呢?下面的代码值得大家试一试。 # coding=utf-8import os.pathimport reimport requestsif not os.path.exists('photo/'): os.mkd
用户头像
sadness安全宇航员 lv.1
0 0 0 2023-01-14
一步一步学爬虫(4)数据存储之MongoDB文档存储

一步一步学爬虫(4)数据存储之MongoDB文档存储

(一步一步学爬虫(4)数据存储之MongoDB文档存储)   NoSQL,全称 Not Only SQL,意为不仅仅是 SQL,泛指非关系型数据库。NoSQL 是基于键值对的,而且不需要经过 SQL 层的解析,数据之间没有耦合性,性能非常高。   非关系型数据库又可细分如下: 键值存储数据库:其代表有 Redis、Voldemort 和 Oracle BDB 等。 列存储数据库:其代表
用户头像
1024king lv.1
0 0 0 2023-01-14
Python设置递归深度(python代码报错maximum recursion depth exceeded)

Python设置递归深度(python代码报错maximum recursion depth exceeded)

现象: Python写了一个递归脚本,运行报错:python maximum recursion depth exceeded 原因: 超过最大递归深度 解决: 手动设置递归深度 import sys sys.setrecursionlimit(1000000) #根据实际情况修改,此处示例设置为一百万 End
用户头像
sanyue科研 lv.1
0 0 0 2023-01-13
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 18