国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

極客小將

您現在的位置是:首頁 » python編程資訊

資訊內容

java爬蟲與python爬蟲對比

極客小將2020-12-29-
簡介java爬蟲與python爬蟲的對比:python做爬蟲語法更簡單,代碼更簡潔。java的語法比python嚴格,而且代碼也更復雜示例如下:url請求:java版的代碼如下:public String call (String url){  

fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

java爬蟲與python爬蟲的對比:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

python做爬蟲語法更簡單,代碼更簡潔。java的語法比python嚴格,而且代碼也更復雜fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

示例如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

url請求:
fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

java版的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

public String call (String url){             String content = "";             BufferedReader in = null;             try{                 URL realUrl = new URL(url);                 URLConnection connection = realUrl.openConnection();                 connection.connect();                 in = new BufferedReader(new InputStreamReader(connection.getInputStream(),"gbk"));                 String line ;                 while ((line = in.readLine()) != null){                     content += line + " ";                 }             }catch (Exception e){                 e.printStackTrace();             }             finally{                 try{                     if (in != null){                         in.close();                     }                 }catch(Exception e2){                     e2.printStackTrace();                 }             }             return content;         }

python版的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

# coding=utf-8 import chardet import urllib2 url = "http://www.baidu.com" data = (urllib2.urlopen(url)).read() charset = chardet.detect(data) code = charset['encoding'] content = str(data).decode(code, 'ignore').encode('utf8') print content

正則表達式fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

java版的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

public String call(String content) throws Exception {             Pattern p = Pattern.compile("content":".*?"");             Matcher match = p.matcher(content);             StringBuilder sb = new StringBuilder();             String tmp;             while (match.find()){                 tmp = match.group();                 tmp = tmp.replaceAll(""", "");                 tmp = tmp.replace("content:", "");                 tmp = tmp.replaceAll("<.*>", "");                 sb.append(tmp + " ");             }             String comment = sb.toString();             return comment;         }     }

python的代碼如下:fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

import repattern = re.compile(正則) group = pattern.findall(字符串)

更多Python知識,請關注:Python自學網!!fN9少兒編程網-Scratch_Python_教程_免費兒童編程學習平臺

預約試聽課

已有385人預約都是免費的,你也試試吧...

主站蜘蛛池模板: 绥江县| 尤溪县| 翼城县| 呈贡县| 白河县| 望江县| 大埔区| 新昌县| 蓝山县| 札达县| 肇源县| 中超| 安达市| 屯门区| 临澧县| 中超| 长乐市| 六盘水市| 资中县| 承德县| 缙云县| 静宁县| 保定市| 铜山县| 萨嘎县| 江阴市| 嘉祥县| 蚌埠市| 偃师市| 沾化县| 洞头县| 平顺县| 金川县| 香港 | 山东| 县级市| 建湖县| 麻栗坡县| 丹江口市| 永泰县| 泰安市|