国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

極客小將

您現在的位置是:首頁 » python編程資訊

資訊內容

java爬蟲與python爬蟲對比

極客小將2020-12-29-
簡介java爬蟲與python爬蟲的對比:python做爬蟲語法更簡單,代碼更簡潔。java的語法比python嚴格,而且代碼也更復雜示例如下:url請求:java版的代碼如下:public String call (String url){  

fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

java爬蟲與python爬蟲的對比:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

python做爬蟲語法更簡單,代碼更簡潔。java的語法比python嚴格,而且代碼也更復雜fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

示例如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

url請求:
fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

java版的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

public String call (String url){             String content = "";             BufferedReader in = null;             try{                 URL realUrl = new URL(url);                 URLConnection connection = realUrl.openConnection();                 connection.connect();                 in = new BufferedReader(new InputStreamReader(connection.getInputStream(),"gbk"));                 String line ;                 while ((line = in.readLine()) != null){                     content += line + " ";                 }             }catch (Exception e){                 e.printStackTrace();             }             finally{                 try{                     if (in != null){                         in.close();                     }                 }catch(Exception e2){                     e2.printStackTrace();                 }             }             return content;         }

python版的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

# coding=utf-8 import chardet import urllib2 url = "http://www.baidu.com" data = (urllib2.urlopen(url)).read() charset = chardet.detect(data) code = charset['encoding'] content = str(data).decode(code, 'ignore').encode('utf8') print content

正則表達式fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

java版的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

public String call(String content) throws Exception {             Pattern p = Pattern.compile("content":".*?"");             Matcher match = p.matcher(content);             StringBuilder sb = new StringBuilder();             String tmp;             while (match.find()){                 tmp = match.group();                 tmp = tmp.replaceAll(""", "");                 tmp = tmp.replace("content:", "");                 tmp = tmp.replaceAll("<.*>", "");                 sb.append(tmp + " ");             }             String comment = sb.toString();             return comment;         }     }

python的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

import repattern = re.compile(正則) group = pattern.findall(字符串)

更多Python知識,請關注:Python自學網!!fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

預約試聽課

已有385人預約都是免費的,你也試試吧...

主站蜘蛛池模板: 昌邑市| 青河县| 中方县| 东港市| 盐津县| 宜昌市| 余庆县| 蒲江县| 仙桃市| 垣曲县| 手机| 平阳县| 朔州市| 高尔夫| 雷波县| 凤阳县| 平塘县| 德清县| 衡东县| 尉氏县| 上杭县| 收藏| 科尔| 呼伦贝尔市| 华坪县| 兰考县| 萨迦县| 富民县| 正镶白旗| 石嘴山市| 观塘区| 阿巴嘎旗| 新密市| 扶绥县| 静宁县| 抚顺县| 高安市| 保德县| 朝阳县| 嘉义市| 个旧市|