> 文章列表 > 使用python采集分享119个PHP江湖论坛源码,总有一款适合您

使用python采集分享119个PHP江湖论坛源码,总有一款适合您

使用python采集分享119个PHP江湖论坛源码,总有一款适合您

分享119个PHP江湖论坛源码,总有一款适合您
 

119个PHP江湖论坛源码下载链接:https://pan.baidu.com/s/1Zz-GiS6WT3i16dZMz-5rvQ?pwd=r416 
提取码:r416

Python采集代码下载链接:采集代码.zip - 蓝奏云

我的博客地址:亚丁号-知识付费平台 支付后可见 扫码付费可见

 

FlashBBS V1.1 中文版(0614)

VBulletin V2.30 简体汉化正式版(紫桐社区)

FlashBBS V1.1 中文版

Discuz! V2.0 繁体中文正式版

Discuz! V2.0 简体中文正式版

QMWDB 论坛 V2.0 功能增强包 SP1

QMWDB 论坛 V2.0

Blue Magic Board V4.0 正式版

VBulletin V2.30 汉化加强版(北飘联盟)

PostNuke V0.723 中文版本 D RC 无雨修正版

Blue Magic Board V4.0 RC

Ctb V1.41 正式版

import os
import shutilimport requests
from bs4 import BeautifulSoupfrom framework.base.BaseFrame import BaseFrame
from sprider.access.SpriderAccess import SpriderAccess
from sprider.plugin.SpriderTools import SpriderTools
from sprider.plugin.UserAgent import UserAgentclass CNSourceCoder:base_url = "http://www.downcode.com"max_pager = 10  # 每页的数量 影响再次采集的起始位置.word_image_count = 5  # word插入图片数量 同时也是明细采集图片和描述的数量page_end_number = 0word_content_list = []haved_sprider_count = 0  # 已经采集的数量sprider_detail_index = 0  # 明细方法采集的数量 累加

FXVBB正式版本 V2.3.0A

VBulletin V2.3.0 完美版(仙境)

Ipb中文Hyper版 V1.1.2

SRPBoard V1.2.1 简体中文测试版

Ctb V1.4 手动安装测试版

WDB论坛全码版本(QMWDB) V1.0

VBB V2.3.0 正式版黄金修正版本(仙境)[0506更新]

Dream Club V0360(WDB修改版)

飘在北京虚拟形象2.0

WDB水晶论坛 M0720(加密版)

Blue Magic Board V3.1

Vbb V2.3.0 最终版黄金修正版

华酷论坛 V1.1.2 Build 0428

CTB V1.3a 后台完整版

华酷论坛 V1.1 Build 0212(IBF论坛中文版)

阳光论坛程序

Vbb V2.3.0 最终版黄金版(仙境)

Vbb V2.3.0 简繁标准版(CNVBB)

君临天下WDB黄金修正版

Vbb V2.3.0

夜猫 - 城市社区YmCity Version 1.0 DEMO

Discuz! V1.03 正式版

Livebord V1.01 Beta2 中文升级补丁

Livebord V1.01 Beta2 简体中文版

PostNuke V0.723 中文版本 D RC

VBB V2.3.0 RC3 标准汉化版

古钺青剑论坛 V2.0

君临天下WDB 完整安装版

Wbb2 Rc 2版论坛

阳光论坛(Warmsun Board) V01.2.0

CNVBB Live风格完整包

def sprider(self,sprider_name,sprider_count,start_number,pager_number,sprider_type,is_show_browse,root_path,first_column_name,second_column_name,is_record_db):"""http://www.downcode.com/sort/j_1_2_1.shtml:param sprider_name::return:"""self.first_folder_name=sprider_type.upper()self.base_path=root_pathself.first_column_name = first_column_nameself.second_column_name = second_column_nameself.sprider_start_count=start_numberself.is_record_db=is_record_dbBaseFrame().debug("开始采集[源码下载站]" + self.first_folder_name + "源码...")BaseFrame().right("本次采集参数:sprider_count(采集数量):" + str(sprider_count) + "")BaseFrame().right("本次采集参数:sprider_name(采集名称):" + sprider_name + "")sprider_url = self.base_url + "/{0}/{1}_1.shtml".format(self.first_column_name, self.second_column_name)# 根据栏目构建URLBaseFrame().debug("本次采集参数:sprider_url:" + sprider_url)self.second_folder_name = str(sprider_count) + "个" + sprider_name  # 二级目录也是wordTitleself.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1  # 起始页码用于效率采集self.file_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_nameBaseFrame().right("本次采集参数:file_path=" + self.file_path + "")# 浏览器的下载路径self.down_path = self.base_path + os.sep + self.first_folder_name+ os.sep + self.second_folder_name+ "\\\\Temp\\\\"BaseFrame().right("本次采集参数:down_path=" + self.down_path + "")# First/PPT/88个动态PPT模板/动态PPT模板self.save_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name + os.sep + sprider_nameBaseFrame().right("本次采集参数:save_path=" + self.save_path + "")if os.path.exists(self.down_path) is True:shutil.rmtree(self.down_path)if os.path.exists(self.down_path) is False:os.makedirs(self.down_path)if os.path.exists(self.save_path) is True:shutil.rmtree(self.save_path)if os.path.exists(self.save_path) is False:os.makedirs(self.save_path)response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))response.encoding = 'gb2312'soup = BeautifulSoup(response.text, "html5lib")#print(soup)element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})page_end_number = 1page_end_url = ""page_end_title = soup.find("a", attrs={"title": '最后页'})page_end_url = page_end_title.get("href")if page_end_url is None or page_end_url == "":page_end_number = 1else:page_end_number = (page_end_url.split(".shtml")[0].split("_")[3])self.page_count = self.merchantwhile self.page_count <= int(page_end_number):  # 翻完停止try:if self.page_count == 1:self.sprider_detail(element_list, page_end_number,sprider_count)passelse:if int(self.haved_sprider_count) == int(sprider_count):BaseFrame().debug("sprider采集到达数量采集停止...")BaseFrame().debug("开始写文章...")SpriderTools.builder_word(self.second_folder_name,self.word_content_list,self.file_path,self.word_image_count,self.first_folder_name)SpriderTools.copy_file(self.word_content_list,self.save_path,self.second_folder_name,self.file_path)SpriderTools.gen_passandtxt(self.second_folder_name, self.word_content_list, self.file_path)BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!")breaknext_url = self.base_url + "/{0}/{1}_{2}.shtml".format(self.first_column_name,self.second_column_name,self.page_count)response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url))response.encoding = 'gb2312'soup = BeautifulSoup(response.text, "html5lib")element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'})self.sprider_detail(element_list, page_end_number,sprider_count)passself.page_count = self.page_count + 1  # 页码增加1except Exception as e:BaseFrame().error("sprider()执行过程出现错误:" + str(e))

Yabbse V1.50 完全版中文语言包

Yabbse V1.50 繁体标准安装版

Yabbse V1.50 完全版

Yabbse V1.50 标准安装版

Blue Magic Board 3.0 正式版

IPB 论坛超强功能版

Zorum 3.0 论坛程序

水柠檬汉化IPB 简体中文测试版

Fud 论坛 V2.37(Hightman修改版)

PTB 030103 版论坛

Blue Magic Board 3 Beta 2

K666 Vbb论坛(自动生成HTML页)

Blue Magic Board 3 Beta 1

Oscommerce 2.2 CNPHPBB汉化版

PHPBB 2.03-2.04升级文件

PhpBB 2.04中文修正版

PostNuke 0.723 Phoenix 中文版本 C

Blue Magic Board 2.3

哆家族论坛V1.4

VBulletin 2.2.9 标准汉化版

疯狂论坛 卡通版 Build 0707配套图片

疯狂论坛Ver 1.0.0 Beta 1202

疯狂论坛 卡通版 Build 0707

PostNuke Phoenix 0.723 中文版本B

PhpBoard(PB2002) 2002.10.10

Ctb文本论坛V1.1001版(手动安装)

Ctb文本论坛V1.1001版(Install安装)

Phpbb2.03mod版(Cnphpbb)

FLASH论坛源文件和制作教程

紫桐社区VB229简体汉化正式版

紫桐社区VB229繁体汉化正式版

小罗天校友录 For Discuz! V2.08稳定—测试版

SRPBoard 1.0.4 简体中文版

Skyboard_2_0_beta贝塔论坛中文版

PHPBB2.03中文版

Cnvbb汉化的VBulletin 2.2.8 Hacker中文版

绿野论坛 Version 5.4.0

 

Blue Magic Board 1.01 正式版

FastBoard论坛源程序

WDB旅行论坛Php

CDB论坛V2.0 Final

一个仿UBB最新版论坛

仿Phpbb的WDB论坛

险情文章管理程序(PHP+文本)

WDB超酷论坛 DREAM CLUBv0100版

CNVBB汉化的VBulletinv2.2.6hacker版

IBF论坛中文版

CNVBB汉化的VBulletinV2.2.6hacker第三版

CNVBB汉化的 VBulletin V 2.2.7 Hacker版

CNVBB汉化的 VBulletin V 2.2.7 标准版

紫桐社区VB227正式版

IBF论坛 1.5 Final最终版

PHP贴图论坛

CDB 2 GOLD 稳定正式版

FastBoard论坛源程序

CNVBB汉化的VBulletin2.2.5hacker版

紫桐社区VB225论坛程序

 

最后送大家一首诗:

山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。