欢迎光临 - 我的站长站,本站所有资源仅供学习与参考,禁止用于商业用途或从事违法行为!

python教程

Python爬取阿里云盘资源

python教程 我的站长站 2022-03-20 共123人阅读
import requests
import re
  
  
class alipanso(object):
    def __init__(self, url, headers, params):
        self.url = url
        self.headers = headers
        self.params = params
          
    def get_html(self):
        response_html = requests.get(self.url, headers=self.headers,params=self.params)
        return response_html.content.decode()
      
    def parse_response_html(self):
        response_data = self.get_html()
        url_name = re.findall('<a href="(.*?)".*W*.*>W*?(.*)W*</a>', response_data)
        name_download_url = []
        n = 1
        for i in url_name:
            download_url = 'https://www.alipanso.com/' + i[0]
            name = i[1]
            name_download_url.append(f'{n}.' + name + '  ' + download_url)
            n += 1
        return name_download_url
      
if __name__ == '__main__':
      
    word = input('请输入要搜索的资源名称:')
    choose = '1.全部文件n''2.视频n' '3.图片n''4.文档n''5.音频n''6.压缩文件n''7.其他'
      
    print('请选择文件类型:')
      
    print(choose)
      
    num = input('请选择选项前的序号:')
      
    format = {
        '1': 'all',
        '2': 'video',
        '3': 'image',
        '4': 'doc',
        '5': 'audio',
        '6': 'zip',
        '7': 'others'
    }
      
    url = 'https://www.alipanso.com/search.html?'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.54 Safari/537.36'
    }
      
    for i in range(1, 10):
        params = {
            'page': f'{i}',
            'keyword': word,
            'search_folder_or_file': '0',
            'is_search_folder_content': '0',
            'is_search_path_title': '0',
            'category': format[num],
            'file_extension': 'all',
            'search_model': '2'
        }
        sosuo = alipanso(url, headers=headers, params=params)
        print(f'第{i}页内容:')
        ziyuan = sosuo.parse_response_html()
        print(ziyuan)
        if not ziyuan:
            break


相关专题
阿里云
阿里云
2022-03-05 1122

阿里云是国内大型互联网服务商之一,我的站长站为大家整理关于阿里云相关信息,包含阿里云最新活动,阿里云域名配置教程,阿里云服务器活动分享....

相关推荐
  • 阿里云盘
  • python爬虫
  • 阿里云盘本地同步上传下载软件V1.0
    阿里云盘本地同步上传下载软件V1.0

    软件介绍百度网盘有本地文件夹同步功能,阿里云网盘还没有。这款阿里云盘本地同步上传下载软件就可以解决这个问题,达到本地与阿里云盘双向同步。软件需要配合谷歌浏览器登录使用,使用前请安装谷歌浏...

    开发软件 179 3年前
  • 阿里云盘分享zip压缩包工具+方法
    阿里云盘分享zip压缩包工具+方法

    软件介绍阿里云盘开启了分享测试,但目前不支持zip压缩包格式,所以想分享压缩包,需要用工具处理下。我的站长站分享这款Jpg+文件粘合剂3.3.9.0工具,可以轻松解决这个问题。阿里云盘分享zip工具截图使...

    开发软件 533 3年前
  • 最新可用百度网盘批量迁移阿里云盘工具
    最新可用百度网盘批量迁移阿里云盘工具

    软件介绍阿里云盘终于开测了分享功能,阿里云盘号称下载不限速,所以像我的站长站这样资源存百度网盘的用户,肯定想把百度网盘资源转到阿里云盘去。毕竟百度网盘下载速度实在是太慢了,开会员也慢。我的...

    开发软件 309 3年前
  • 阿里云盘注册邀请码,免费领取1T容量
    阿里云盘注册邀请码,免费领取1T容量

    最新可用阿里云盘注册邀请码,注册即可免费领取1T容量,我的站长站已经测试,邀请码可用,我的站长站已经注册成功了,分享给大家。据说,这个邀请码不定期可用。阿里云盘邀请码截图阿里云盘邀请码YUNPAN阿里...

    经验分享 735 3年前
  • 阿里云推出不限速阿里云盘
    阿里云推出不限速阿里云盘

    阿里云对外宣传推出了一款名为“阿里云网盘”的独立应用,该应用由阿里云团队开发,定位是为C端用户提供可靠安全的网盘产品。现在各大平台都网友纷纷谴责百度网盘限速严重,阿里云这个时候推出自己的...

    网络新闻 299 4年前
  • Python好看视频地址解析下载代码

    #encoding:utf-8# 好看视频下载 import socketfrom urllib.request import urlopenimport urllibimport reimport timefrom pyquery import PyQuery as pqimport requestsfrom tqdm import tqdm # 打印进度条的库import gzip print(&#39;程序开始运...

    python教程 134 2年前
  • python美女写真图库爬虫

    import requestsfrom lxml import etreeimport csvfrom time import sleepimport osfrom concurrent.futures import ThreadPoolExecutor headers = { &#39;user-agent&#39;: &#39;Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit...

    python教程 55 3年前
  • 笔趣阁小说网Python爬虫分享

    #[url=https://www.biquge.info/wanjiexiaoshuo/]https://www.biquge.info/wanjiexiaoshuo/[/url] 笔趣阁小说全本爬虫import timeimport requestsimport osimport randomfrom lxml import etreeimport webbrowserheader = { "User-Agent": "Mo...

    python教程 167 3年前
  • Python爬取站长之家端口扫描接口

    import requests,timeimport randomfrom bs4 import BeautifulSoupimport reimport threadingdef ports(hostm,port): url = &#39;http://tool.chinaz.com/port/&#39; headers = { &#39;User-Agent&#39;:&#39;Mozilla/5.0 (Windows NT ...

    python教程 89 3年前
  • python爬虫下载抖音用户所有短视频+无水印方法

    这次分享下载抖音用户所有短视频方法,python爬虫批量抓取,无水印下载,希望和大家多多交流互相学习!获取用户链接方法1、首先在抖音上随机挑选一个小姐姐,用户主页右上角点开,获取分享链接python下载抖音视频截图得到类似分享链接:在抖音,记录美好生活! https:...

    python教程 306 3年前