国产日韩欧美一区二区三区综合,日本黄色免费在线,国产精品麻豆欧美日韩ww,色综合狠狠操

極客小將

您現(xiàn)在的位置是:首頁 » python編程資訊

資訊內(nèi)容

Python數(shù)據(jù)分析實戰(zhàn)之 概述數(shù)據(jù)分析

極客小將2021-01-16-
簡介Python教程欄目介紹概述數(shù)據(jù)。推薦(免費):Python教程文章目錄一、入門數(shù)據(jù)分析1.大數(shù)據(jù)時代的基本面2.數(shù)據(jù)分析師職業(yè)前景3.成為數(shù)據(jù)分析師之路二、Python的安裝與環(huán)境配置1.Python版本2.不同系統(tǒng)安裝Python3.環(huán)境變量配置4.安裝pip5.集成開發(fā)環(huán)境選擇三、Anacon
版權(quán)所有:https://wWw.pxcodeS.com python教程欄目介紹概述數(shù)據(jù)。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

推薦(免費):python教程10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

文章目錄10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

一、入門數(shù)據(jù)分析1.大數(shù)據(jù)時代的基本面2.數(shù)據(jù)分析師職業(yè)前景3.成為數(shù)據(jù)分析師之路二、Python的安裝與環(huán)境配置1.Python版本2.不同系統(tǒng)安裝Python3.環(huán)境變量配置4.安裝pip5.集成開發(fā)環(huán)境選擇三、Anaconda的介紹與安裝1.Anaconda是什么2.下載和安裝Anaconda3.conda工具的介紹和包管理四、Jupyter Notebook1.Jupyter Notebook基本介紹2.Jupyter Notebook的使用3.Jupyter中使用Python4.數(shù)據(jù)交互案例加載csv數(shù)據(jù),處理數(shù)據(jù),保存到MongoDB數(shù)據(jù)庫使用Jupyter處理商鋪數(shù)據(jù)

一、入門數(shù)據(jù)分析10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

1.大數(shù)據(jù)時代的基本面10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

大數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀:
現(xiàn)在數(shù)據(jù)已經(jīng)呈現(xiàn)出了爆炸式的增長,每一分鐘可能就會有:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

13000+個iPhone應(yīng)用下載Twitter上發(fā)布98000+新微博發(fā)出1.68億+條Email淘寶雙十一10680+個新訂單12306出票1840+張

在大數(shù)據(jù)時代,出現(xiàn)了三大變革:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

從隨機樣本到全量數(shù)據(jù)從精確性到混雜性從因果關(guān)系到相關(guān)關(guān)系

舉一個典型的例子:
男士到超市買尿布會順帶買一些啤酒,通過大數(shù)據(jù)分析出的結(jié)果促使超市在尿布的貨架附近放一些啤酒,從而增大銷量,買尿布與買啤酒之間沒有因果關(guān)系,但是存在著某種相關(guān)關(guān)系。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

國內(nèi)大數(shù)據(jù)應(yīng)用狀況如下(來自CSDN):
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以看到,大數(shù)據(jù)的應(yīng)用已經(jīng)具有一定規(guī)模,但是還有很大的發(fā)展空間。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

人才方面的需求主要包括:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

數(shù)據(jù)分析師統(tǒng)計分析預(yù)測分析流程優(yōu)化大數(shù)據(jù)工程師平臺開發(fā)應(yīng)用開發(fā)技術(shù)支撐數(shù)據(jù)架構(gòu)師業(yè)務(wù)理解應(yīng)用部署架構(gòu)設(shè)計

之所以要學(xué)習(xí)數(shù)據(jù)分析,是因為數(shù)據(jù)正變得越來越常見和廉價,分析可以為數(shù)據(jù)提供稀缺且附帶額外價值的服務(wù)。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

2.數(shù)據(jù)分析師職業(yè)前景10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

數(shù)據(jù)分析師需要解決的問題:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

預(yù)估需求、分配產(chǎn)能
在大數(shù)據(jù)時代,更需要解讀數(shù)據(jù)的能力。
Q:烤箱的產(chǎn)能有限,該選擇生產(chǎn)哪些種類的面包?
A:列出**受歡迎的幾種面包,優(yōu)先生產(chǎn)明星商品。
關(guān)鍵是找出明星商品,這需要統(tǒng)計出面包的總營業(yè)額,再算出每種面包占總營業(yè)額的相對比例,優(yōu)先生產(chǎn)能囊括七成營業(yè)額的產(chǎn)品組合。這會用到統(tǒng)計的次數(shù)分配表和直方圖,此種分析法也稱為ABC分析法,如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

評估行銷方案成效
統(tǒng)計并不是分析數(shù)據(jù)就好了,從分析的結(jié)果推測該如何影響顧客的行為,并且將之?dāng)M定為具體的商業(yè)計劃,并據(jù)此行動才是關(guān)鍵。
Q:想在網(wǎng)上銷售面包,哪一種廣告比較有效?
A:寫出兩種文案,分別廣告一段時間看看成效如何。
要比較廣告成效,**好的方法是用統(tǒng)計的隨機對照實驗,讓兩種廣告隨機出現(xiàn),一段時間后,觀察哪種廣告的效果比較好,再大范圍運用效果比較好的廣告。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

產(chǎn)品品管
發(fā)現(xiàn)結(jié)果以及形成結(jié)果的原因之間的關(guān)系非常重要。
Q:怎么從面包判斷面包師傅有沒有偷工減料?
A:抽查幾個面包,秤秤看重量差距有沒有過大。
你需要先知道面包的平均重量,再對面包進行抽樣,看看面包的重量是否呈現(xiàn)常態(tài)分布的鐘形曲線?若是偏離曲線,就可能暗示面包品管有問題。如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

一名好的數(shù)據(jù)分析師是一個好的產(chǎn)品規(guī)劃者和行業(yè)的領(lǐng)跑者;
在IT企業(yè),**的數(shù)據(jù)分析師很有希望成為公司的高層。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

數(shù)據(jù)分析師的工作流程如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

數(shù)據(jù)分析師的三大任務(wù):10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

分析歷史預(yù)測未來優(yōu)化選擇

數(shù)據(jù)分析師要求的8項技能:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

統(tǒng)計學(xué)統(tǒng)計檢驗、P值、分布、估計基本工具PythonSQL多變量微積分和線性代數(shù)數(shù)據(jù)整理數(shù)據(jù)可視化軟件工程機器學(xué)習(xí)數(shù)據(jù)科學(xué)家的思維數(shù)據(jù)驅(qū)動問題解決

數(shù)據(jù)分析師要求的三大能力:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

統(tǒng)計學(xué)基礎(chǔ)和分析工具應(yīng)用計算機編碼能力特定應(yīng)用領(lǐng)域或行業(yè)的知識

典型的數(shù)據(jù)分析師的成長歷程:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

3.成為數(shù)據(jù)分析師之路10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

成為數(shù)據(jù)分析師的自我修養(yǎng):10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

敏感探究細(xì)致務(wù)實

數(shù)據(jù)分析師需要具備的技能如下:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

熟悉Excel數(shù)據(jù)處理數(shù)據(jù)敏感度較強熟悉公司業(yè)務(wù)和行業(yè)知識掌握數(shù)據(jù)分析方法基本分析方法 對比分析法分組分析法交叉分析法結(jié)構(gòu)分析法漏斗圖分析法綜合評價分析法因素分析法矩陣關(guān)聯(lián)分析高級分析方法 相關(guān)分析法回歸分析法聚類分析法判別分析法主成分分析法因子分析法對應(yīng)分析法時間序列

在不同行業(yè)數(shù)據(jù)分析從業(yè)人員的工作內(nèi)容和職責(zé):10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

從事數(shù)據(jù)分析的工作學(xué)做日報日銷、庫存類的表產(chǎn)品銷售預(yù)測庫存計算和預(yù)警流量分析相關(guān)表復(fù)盤數(shù)據(jù)分析挖掘工作人員給產(chǎn)品優(yōu)化提供數(shù)據(jù)支持驗證產(chǎn)品改進效果為高層提供郵件和報表互聯(lián)網(wǎng)+分析KPI指標(biāo)監(jiān)控各種周期性報表針對某一業(yè)務(wù)問題做分析報告針對業(yè)務(wù)進行線下建模和分析

數(shù)據(jù)分析很重要的學(xué)科基礎(chǔ)是數(shù)學(xué),但是數(shù)學(xué)不好也沒有關(guān)系,可以用Python來幫助學(xué)習(xí):
Python不僅是一門編程語言,而且是數(shù)據(jù)挖掘機器學(xué)習(xí)等技術(shù)的基礎(chǔ),方便建立自動化的工作流;
Python入門不難,它對數(shù)學(xué)要求并不是太高,重要的是需要知道如何用語言表達(dá)一個算法邏輯;
Python有很多封裝好的工具庫和命令,需要做的是用哪些數(shù)學(xué)方法解決一個問題,并構(gòu)建出來。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

要想快速入門Python數(shù)據(jù)分析,就要使用好Python相關(guān)的工具包:
(1)Python**大的特點是擁有一個巨大而活躍的科學(xué)計算社區(qū),采用python進行科學(xué)計算的趨勢也越來越明顯。
(2)由于Python有不斷改良的庫,使其成為數(shù)據(jù)處理任務(wù)的一大代替方案,結(jié)合其在通用編程方面的強大實力,完全可以只是用Python這一種語言去構(gòu)建以數(shù)據(jù)為中心的應(yīng)用程序,其中:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

常用數(shù)據(jù)分析庫NumpyScipyPandasmatplotlib常用高級數(shù)據(jù)分析庫nltkigraphscikit-learn

(3)作為一個科學(xué)計算平臺,Python的能夠輕松集成C、C++以及Fortran代碼。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

數(shù)據(jù)分析的準(zhǔn)備工作:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

了解數(shù)據(jù)數(shù)據(jù)清洗與初步分析繪圖與可視化數(shù)據(jù)聚合與分組處理數(shù)據(jù)挖掘

數(shù)據(jù)分析與數(shù)據(jù)挖掘的常用算法:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

線性回歸時間序列分析分類算法聚類算法降維算法

學(xué)習(xí)和從事數(shù)據(jù)分析工作的方法為:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

勤思考多動手多總結(jié)

二、Python的安裝與環(huán)境配置10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

1.Python版本10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Python分為3.X和2.X兩個大版本。
Python的3.0版本,常被稱為Python 3000,或簡稱Py3k。相對于Python的早期版本,這是一個較大的升級。
為了不帶入過多的累贅,Python 3.X在設(shè)計的時候沒有考慮向下相容,許多針對早期Python版本設(shè)計的程式都無法在Python 3.X上正常執(zhí)行。
大多數(shù)第三方庫都正在努力地相容Python 3.X版本。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

2.不同系統(tǒng)安裝Python10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

(1)Unix & Linux系統(tǒng)10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

訪問http://www.python.org/download/選擇適用于Unix/Linux的源碼壓縮包 下載及解壓壓縮包如果你需要自定義一些選項,修改Modules/Setup執(zhí)行./configure腳本makemake install

(2)Window系統(tǒng)10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

訪問http://www.python.org/download/在下載列表中選擇Window平臺安裝包
由于*網(wǎng)下載很緩慢,因此我已經(jīng)將Python各版本的安裝包下載整理好了,可以直接點擊加QQ群 963624318 在群文件夾Python相關(guān)安裝包中下載即可。下載后,雙擊下載包,進入Python安裝向?qū)?,安裝非常簡單,只需要使用默認(rèn)的設(shè)置一直點擊下一步直到安裝完成即可。

(3)Mac系統(tǒng)
自帶python 2.7,可以執(zhí)行brew install python安裝新版本。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

3.環(huán)境變量配置10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Windows系統(tǒng)需要配置環(huán)境變量。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

如果在安裝Python時沒有選擇添加環(huán)境變量,則需要手動添加,需要將安裝Python的路徑XXXPythonXXX和XXXPythonXXXScripts添加到環(huán)境變量,有兩種方式:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

命令行添加
CMD中分別執(zhí)行path=%path%;XXXPythonXXX和path=%path%;XXXPythonXXXScripts即可。在系統(tǒng)設(shè)置中添加
右鍵計算機 → 屬性 → 高級系統(tǒng)設(shè)置 → 系統(tǒng)屬性 → 環(huán)境變量 → 雙擊path → 添加XXXPythonXXX和XXXPythonXXXScripts安裝路徑,如下:

**后依次點擊確認(rèn)退出即可。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

4.安裝pip10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

pip是Python中的包安裝和管理工具,在安裝Python時可以選擇安裝pip,在Python 2 >=2.7.9或Python 3 >=3.4中自帶。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

如果沒有安裝pip,可以通過命令安裝:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Linux或者Mac
pip install -U pipWindows(cmd輸入)
python -m pip install -U pip

5.集成開發(fā)環(huán)境選擇10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Python有很多編輯器,包括PyCharm等,這里選擇PyCharm:
PyCharm是由JetBrains打造的一款Python IDE,支Mac OS、Windows、Linux系統(tǒng)。
包含調(diào)試、語法高亮、Project管理、代碼跳轉(zhuǎn)、智能提示、自動完成、單元測試、版本控制等功能。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以在https://www.jetbrains.com/pycharm/download/選擇合適的版本進行下載安裝即可。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

三、Anaconda的介紹與安裝10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

1.Anaconda是什么10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Anaconda是一個可用于科學(xué)計算的Python發(fā)行版,支持Linux、Mac、Windows系統(tǒng),內(nèi)置了常用的科學(xué)計算庫。
它解決了*方Python的兩大痛點:
(1)提供了包管理功能,Windows平臺安裝第三方包經(jīng)常失敗的場景得以解決;
(2)提供環(huán)境管理的功能,功能類似virtualenv,解決了多版本Python并存、切換的問題 。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

2.下載和安裝Anaconda10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

直接在*網(wǎng)https://www.anaconda.com/products/inpidual下載安裝包,選擇下載Python3.8的安裝包個人版即可,但是*網(wǎng)下載速度較慢,因此我已經(jīng)將Python3.8對應(yīng)的Anaconda安裝包下載整理好了,可以直接點擊加QQ群 963624318 在群文件夾Python相關(guān)安裝包中下載即可。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

下載完成后直接安裝,需要注意,在點擊過程中會出現(xiàn)添加環(huán)境變量的提示,需要勾選,如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

**后依次點擊下一步、安裝完成后,點擊Win鍵(Windows系統(tǒng)下)可以看到**近添加或應(yīng)用列表A下如圖:

10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

此時可點擊Anaconda Navigator,如下所示:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以看到環(huán)境為Python 3.8.3,Anaconda創(chuàng)建的基礎(chǔ)環(huán)境名為base,也是默認(rèn)環(huán)境,也可以看到默認(rèn)安裝的庫。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

再打開Anaconda命令行工具 Anaconda Powershell Prompt,輸入python -V,也打印Python 3.8.3。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

還可以通過命令創(chuàng)建新的conda環(huán)境,如conda create --name py27 python=2.7執(zhí)行后即創(chuàng)建了一個名為py27的Python版本為2.7的conda環(huán)境。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

激活環(huán)境執(zhí)行命令conda activate py27,停用使用命令conda deactivate。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以在命令行中執(zhí)行conda list查看已經(jīng)安裝的庫,如下:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

# packages in environment at E:Anaconda3: # # Name Version Build Channel _ipyw_jlab_nb_ext_conf 0.1.0 py38_0 alabaster 0.7.12 py_0 anaconda 2020.07 py38_0 anaconda-client 1.7.2 py38_0 anaconda-navigator 1.9.12 py38_0 ... zlib 1.2.11 h62dcd97_4 zope 1.0 py38_1 zope.event 4.4 py38_0 zope.interface 4.7.1 py38he774522_0 zstd 1.4.5 ha9fde0e_0

3.conda工具的介紹和包管理10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

conda是Anaconda下用于包管理和環(huán)境管理的工具,功能上類似pip和virtualenv的組合,conda的環(huán)境管理與virtualenv是基本上是類似的操作。
安裝成功后conda會默認(rèn)加入到環(huán)境變量中,因此可直接在命令行窗口運行conda命令。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

常見的conda命令和含義如下:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

命令含義conda命令conda –h查看幫助基于python3.6版本創(chuàng)建名為python36的環(huán)境conda create --name python36 python=3.6激活此環(huán)境activate python36(Windows)、source activate python36(linux/mac)查看python版本python -V退出當(dāng)前環(huán)境deactivate python36刪除環(huán)境conda remove -n py27 --all查看所有安裝的環(huán)境conda info -e

conda的包管理常見命令如下:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

包管理命令意義包管理命令安裝matplotlibconda install matplotlib查看已安裝的包conda list包更新conda update matplotlib刪除包conda remove matplotlib

在conda中,anything is a package一切皆是包,conda本身可以看作是一個包,python環(huán)境可以看作是一個包,anaconda也可以看作是一個包,因此除了普通的第三方包支持更新之外,這3個包也支持如下命令:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

操作命令更新conda本身conda update conda更新anaconda應(yīng)用conda update anaconda更新python,假設(shè)當(dāng)前python環(huán)境是3.8.1,而**新版本是3.8.2,那么就會升級到3.8.2conda update python

四、Jupyter Notebook10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

1.Jupyter Notebook基本介紹10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Jupyter Notebook(此前被稱為IPython notebook)是一個交互式筆記本,支持運行40多種編程語言。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

在開始使用notebook之前,需要先安裝該庫:
(1)在命令行中執(zhí)行pip install jupyter來安裝;
(2)安裝Anaconda后自帶Jupyter Notebook。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

在命令行中執(zhí)行jupyter notebook,就會在當(dāng)前目錄下啟動Jupyter服務(wù)并使用默認(rèn)瀏覽器打開頁面,還可以復(fù)制鏈接到其他瀏覽器中打開,如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以看到,notebook界面由以下部分組成:
(1)notebook名稱;
(2)主工具欄,提供了保存、導(dǎo)出、重載notebook,以及重啟內(nèi)核等選項;
(3)notebook主要區(qū)域,包含了notebook的內(nèi)容編輯區(qū)。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

2.Jupyter Notebook的使用10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

在Jupyter頁面下方的主要區(qū)域,由被稱為單元格的部分組成。每個notebook由多個單元格構(gòu)成,而每個單元格又可以有不同的用途。
上圖中看到的是一個代碼單元格(code cell),以[ ]開頭,在這種類型的單元格中,可以輸入任意代碼并執(zhí)行。
例如,輸入1 + 2并按下Shift + Enter,單元格中的代碼就會被計算,光標(biāo)也會被移動到一個新的單元格中。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

如果想新建一個notebook,只需要點擊 New,選擇希望啟動的notebook類型即可。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

簡單使用示意如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以看到,notebook可以修改之前的單元格,對其重新計算,這樣就可以更新整個文檔了。如果你不想重新運行整個腳本,只想用不同的參數(shù)測試某個程式的話,這個特性顯得尤其強大。
不過,也可以重新計算整個notebook,只要點擊Cell -> Run all即可。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

再測試標(biāo)題和其他代碼如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以看到,在頂部添加了一個notebook的標(biāo)題,還可以執(zhí)行for循環(huán)等語句。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

3.Jupyter中使用Python10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Jupyter測試Python變量和數(shù)據(jù)類型如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

測試Python函數(shù)如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

測試Python模塊如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以看到,在執(zhí)行出錯時,也會拋出異常。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

測試數(shù)據(jù)讀寫如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

數(shù)據(jù)讀寫很重要,因為進行數(shù)據(jù)分析時必須先讀取數(shù)據(jù),進行數(shù)據(jù)處理后也要進行保存。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

4.數(shù)據(jù)交互案例10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

加載csv數(shù)據(jù),處理數(shù)據(jù),保存到MongoDB數(shù)據(jù)庫10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

有csv文件shopproducts.csv和userratings.csv,分別是商品數(shù)據(jù)和用戶評分?jǐn)?shù)據(jù),如下:

10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

如需獲取數(shù)據(jù)、代碼等相關(guān)文件進行測試學(xué)習(xí),可以直接點擊加QQ群 963624318 在群文件夾Python數(shù)據(jù)分析實戰(zhàn)中下載即可。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

現(xiàn)在需要通過Python將其讀取出來,并將指定的字段保存到MongoDB中,需要在Anaconda中執(zhí)行命令conda install pymongo安裝pymongo。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Python代碼如下:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

import pymongoclass Product: def __init__(self,productId:int ,name, imageUrl, categories, tags): self.productId = productId self.name = name self.imageUrl = imageUrl self.categories = categories self.tags = tags def __str__(self) -> str: return self.productId +'^' + self.name +'^' + self.imageUrl +'^' + self.categories +'^' + self.tagsclass Rating: def __init__(self, userId:int, productId:int, score:float, timestamp:int): self.userId = userId self.productId = productId self.score = score self.timestamp = timestamp def __str__(self) -> str: return self.userId +'^' + self.productId +'^' + self.score +'^' + self.timestampif __name__ == '__main__': myclient = pymongo.MongoClient("mongodb://127.0.0.1:27017/") mydb = myclient["goods-users"] # val attr = item.split("\^") # // 轉(zhuǎn)換成Product # Product(attr(0).toInt, attr(1).trim, attr(4).trim, attr(5).trim, attr(6).trim) shopproducts = mydb['shopproducts'] with open('shopproducts.csv', 'r',encoding='UTF-8') as f: item = f.readline() while item: attr = item.split('^') product = Product(int(attr[0]), attr[1].strip(), attr[4].strip(), attr[5].strip(), attr[6].strip()) shopproducts.insert_one(product.__dict__) # print(product) # print(json.dumps(obj=product.__dict__,ensure_ascii=False)) item = f.readline() # val attr = item.split(",") # Rating(attr(0).toInt, attr(1).toInt, attr(2).toDouble, attr(3).toInt) userratings = mydb['userratings'] with open('userratings.csv', 'r',encoding='UTF-8') as f: item = f.readline() while item: attr = item.split(',') rating = Rating(int(attr[0]), int(attr[1].strip()), float(attr[2].strip()), int(attr[3].strip())) userratings.insert_one(rating.__dict__) # print(rating) item = f.readline()

在啟動MongoDB服務(wù)后,運行Python代碼,運行完成后,再通過Robo 3T查看數(shù)據(jù)庫如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

顯然,保存數(shù)據(jù)成功。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

使用Jupyter處理商鋪數(shù)據(jù)10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

待處理的數(shù)據(jù)是商鋪數(shù)據(jù),如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

包括名稱、評論數(shù)、價格、地址、評分列表等,其中評論數(shù)、價格和評分均不規(guī)則、需要進行數(shù)據(jù)清洗。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

如需獲取數(shù)據(jù)、代碼等相關(guān)文件進行測試學(xué)習(xí),可以直接點擊加QQ群 963624318 在群文件夾Python數(shù)據(jù)分析實戰(zhàn)中下載即可。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

Jupyter中處理如下:
10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

可以看到,**后得到了經(jīng)過清洗后的規(guī)則數(shù)據(jù)。10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

完整Python代碼如下:10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

# 數(shù)據(jù)讀取f = open('商鋪數(shù)據(jù).csv', 'r', encoding='utf8')for i in f.readlines()[1:15]: print(i.split(','))# 創(chuàng)建comment、price、commentlist清洗函數(shù)def fcomment(s): '''comment清洗函數(shù):用空格分段,選取結(jié)果list的第一個為點評數(shù),并且轉(zhuǎn)化為整型''' if '條' in s: return int(s.split(' ')[0]) else: return '缺失數(shù)據(jù)'def fprice(s): '''price清洗函數(shù):用¥分段,選取結(jié)果list的**后一個為人均價格,并且轉(zhuǎn)化為浮點型''' if '¥' in s: return float(s.split('¥')[-1]) else: return '缺失數(shù)據(jù)'def fcommentl(s): '''commentlist清洗函數(shù):用空格分段,分別清洗出質(zhì)量、環(huán)境及服務(wù)數(shù)據(jù),并轉(zhuǎn)化為浮點型''' if ' ' in s: quality = float(s.split(' ')[0][2:]) environment = float(s.split(' ')[1][2:]) service = float(s.split(' ')[2][2:-1]) return [quality, environment, service] else: return '缺失數(shù)據(jù)'# 數(shù)據(jù)處理清洗datalist = [] # 創(chuàng)建空列表f.seek(0)n = 0 # 創(chuàng)建計數(shù)變量for i in f.readlines(): data = i.split(',') # print(data) classify = data[0] # 提取分類 name = data[1] # 提取店鋪名稱 comment_count = fcomment(data[2]) # 提取評論數(shù)量 star = data[3] # 提取星級 price = fprice(data[4]) # 提取人均 address = data[5] # 提取地址 quality = fcommentl(data[6])[0] # 提取質(zhì)量評分 env = fcommentl(data[6])[1] # 提取環(huán)境評分 service = fcommentl(data[6])[2] # 提取服務(wù)評分 if '缺失數(shù)據(jù)' not in [comment_count, price, quality]: # 用于判斷是否有數(shù)據(jù)缺失 n += 1 data_re = [['classify', classify], ['name', name], ['comment_count', comment_count], ['star', star], ['price', price], ['address', address], ['quality', quality], ['environment', env], ['service', service]] datalist.append(dict(data_re)) # 字典生成,并存入列表datalist print('成功加載%i條數(shù)據(jù)' % n) else: continueprint(datalist)print('總共加載%i條數(shù)據(jù)' % n)f.close()

更多編程相關(guān)知識,請訪問:編程教學(xué)!!

以上就是Python數(shù)據(jù)分析實戰(zhàn)之 概述數(shù)據(jù)分析的詳細(xì)內(nèi)容,更多請關(guān)注少兒編程網(wǎng)其它相關(guān)文章!10y少兒編程網(wǎng)-Scratch_Python_教程_免費兒童編程學(xué)習(xí)平臺

預(yù)約試聽課

已有385人預(yù)約都是免費的,你也試試吧...

主站蜘蛛池模板: 海口市| 巴马| 女性| 和林格尔县| 宁武县| 嘉黎县| 德钦县| 尤溪县| 高青县| 青川县| 汝阳县| 鄂尔多斯市| 漳州市| 龙岩市| 陆丰市| 安达市| 连平县| 小金县| 肃宁县| 教育| 隆安县| 青铜峡市| 合水县| 泽普县| 通许县| 雅安市| 大方县| 大田县| 南漳县| 红原县| 留坝县| 宣汉县| 富顺县| 辉南县| 嘉兴市| 灵宝市| 宜君县| 门头沟区| 子长县| 鄱阳县| 博客|