本書從Python的基本語法入手,由淺入深、循序漸進地引領(lǐng)讀者從Python的基本程序開始,逐步進入Python數(shù)據(jù)爬取、數(shù)據(jù)分析、機器學習等內(nèi)容的學習。本書內(nèi)容分為5個項目,第1個項目介紹了Python的基本程序結(jié)構(gòu),包括Python的條件、循環(huán)、異常等程序語句與結(jié)構(gòu)。第2個項目介紹了函數(shù)與模塊、字符串、列表、元組、字典、集合等數(shù)據(jù)類型的應用與文件操作。第3個項目介紹了Web程序的基本概念與Python爬取Web網(wǎng)站數(shù)據(jù)的基本方法。第4個項目介紹了NumPy、Pandas、Matplotlib等Python數(shù)據(jù)分析模塊的操作與應用。第5個項目介紹了K-means、KNN、線性回歸等機器學習的基本方法,同時介紹了sklearn機器學習庫的基本應用。為了進一步學習與鞏固所學知識與技能,在各項目的結(jié)尾都設(shè)計了一個綜合任務。
本書可作為高職高專院校大數(shù)據(jù)技術(shù)與應用、計算機信息管理、云計算技術(shù)與應用等專業(yè)的教材,也可作為從事大數(shù)據(jù)開發(fā)的專業(yè)技術(shù)人員的參考書。相關(guān)教學課件請登錄www.xduph.com進行下載。
Python語言具有開源、免費、功能強大、語法簡潔清晰、簡單易學、數(shù)據(jù)類型豐富、面向?qū)ο蟮忍攸c,非常適合初學者學習。而且Python有十分豐富的程序包來滿足用戶需求,這也是Python的魅力所在。近年來Python語言在數(shù)據(jù)分析、人工智能等領(lǐng)域得到了廣泛的應用。
如果你是一個初學者,想學習Python程序設(shè)計基礎(chǔ)、Python數(shù)據(jù)分析、Python機器學習基礎(chǔ),那么本書是很合適的選擇。
本書采用項目驅(qū)動的模式編寫,全書共5個項目,涵蓋了Python程序基礎(chǔ)、數(shù)據(jù)分析、機器學習等基本知識與技能。第1個項目為“Python程序設(shè)計基礎(chǔ)”,介紹了Python的基本程序結(jié)構(gòu),包括Python的條件、循環(huán)、異常等程序語句與結(jié)構(gòu)。第2個項目為“Python程序設(shè)計進階”,介紹了函數(shù)與模塊、字符串、列表、元組、字典、集合等數(shù)據(jù)類型的應用與文件操作。第3個項目為“Python數(shù)據(jù)采集基礎(chǔ)”,介紹了Web程序的基本概念與Python爬取Web網(wǎng)站數(shù)據(jù)的基本方法。第4個項目為“Python數(shù)據(jù)分析基礎(chǔ)”介紹了NumPy、Pandas、Matplotlib等Python數(shù)據(jù)分析模塊的操作與應用。第5個項目為“Python機器學習基礎(chǔ)”,介紹了K-means、KNN、線性回歸等機器學習的基本方法,同時介紹了sklearn機器學習庫的基本應用。為了進一步學習與鞏固所學知識與技能,在各項目的結(jié)尾都設(shè)計了一個綜合任務。
要學習好一門程序語言,除了要掌握語言的基本規(guī)則外,還要經(jīng)過大量的實踐,學習程序設(shè)計是一個“學中做、做中學”的循環(huán)過程。只有把學習的知識應用到實踐中,才能鞏固所學知識,提高編程技能。
本書是深圳信息職業(yè)技術(shù)學院的一線教師經(jīng)過多年的教學積累,對講義進行改
編與完善后編寫完成的,適合職業(yè)院校相關(guān)專業(yè)作為教材使用,建議教學學時為54
學時。
由于作者水平有限,難免有考慮不周或疏漏之處,歡迎廣大讀者批評指正。
項目1 Python程序設(shè)計基礎(chǔ) 1
任務1.1 認識Python 1
1.1.1 Python簡介 1
1.1.2 Python與數(shù)據(jù)分析 2
任務1.2 搭建開發(fā)環(huán)境 2
1.2.1 Python的安裝 2
1.2.2 Python IDE簡介 3
1.2.3 編寫Python程序 4
任務1.3 程序基本結(jié)構(gòu) 6
1.3.1 標識符變量與保留字符 6
1.3.2 縮進和多行語句 8
1.3.3 引號與注釋 8
1.3.4 輸出與中文編碼 9
任務1.4 數(shù)據(jù)類型 10
1.4.1 常用數(shù)據(jù)類型 10
1.4.2 運算符 10
1.4.3 成員與身份運算符 12
1.4.4 格式化輸出 13
任務1.5 條件分支語句 15
1.5.1 條件語句 15
1.5.2 復雜條件語句 17
任務1.6 while循環(huán) 19
1.6.1 while循環(huán)語句 19
1.6.2 循環(huán)的退出 21
任務1.7 for循環(huán) 24
1.7.1 for循環(huán)語句 24
1.7.2 for循環(huán)的退出 25
1.7.3 for循環(huán)注意事項 26
1.7.4 嵌套結(jié)構(gòu) 27
任務1.8 異常處理 30
1.8.1 異常情況 30
1.8.2 異常語句 31
1.8.3 拋出異常 32
1.8.4 簡單異常語句 33
綜合任務 打印萬年日歷 34
一、項目背景 34
二、項目設(shè)計 35
三、程序代碼 36
練習 37
項目2 Python程序設(shè)計進階 38
任務2.1 Python函數(shù) 38
2.1.1 函數(shù)定義 38
2.1.2 變量范圍 41
2.1.3 函數(shù)默認參數(shù) 43
2.1.4 匿名函數(shù) 45
任務2.2 Python模塊 45
2.2.1 Python模塊 45
2.2.2 math模塊 46
2.2.3 時間和日期模塊 47
2.2.4 random模塊 49
任務2.3 字符串類型 49
2.3.1 字符串類型 49
2.3.2 字符串函數(shù) 51
任務2.4 列表與元組類型 57
2.4.1 列表類型 57
2.4.2 列表常用操作函數(shù) 60
2.4.3 列表與函數(shù) 62
2.4.4 元組類型 63
任務2.5 字典類型 65
2.5.1 字典類型 65
2.5.2 字典操作 65
2.5.3 字典與函數(shù) 69
2.5.4 字典參數(shù) 70
任務2.6 集合類型 71
2.6.1 認識集合 71
2.6.2 集合操作 72
任務2.7 文件操作 74
2.7.1 讀寫文本文件 74
2.7.2 讀寫二進制文件 76
綜合任務 學生記錄管理 79
一、項目背景 79
二、項目設(shè)計 80
三、程序代碼 80
練習 84
項目3 Python數(shù)據(jù)采集基礎(chǔ) 86
任務3.1 Flask Web網(wǎng)站 86
3.1.1 Flask創(chuàng)建網(wǎng)站 86
3.1.2 Flask顯示靜態(tài)網(wǎng)頁 88
任務3.2 訪問Web網(wǎng)站 89
3.2.1 創(chuàng)建Web網(wǎng)站 89
3.2.2 urlib庫 90
3.2.3 requests庫 91
任務3.3 正則表達式 92
3.3.1 匹配模式 92
3.3.2 re模塊與字符基礎(chǔ)匹配 92
3.3.3 re模塊與字符高級匹配 96
3.3.4 re模塊的綜合應用 97
任務3.4 Python網(wǎng)絡爬蟲基礎(chǔ) 99
3.4.1 BeautifulSoup爬取數(shù)據(jù) 99
3.4.2 BeautifulSoup爬蟲程序 105
綜合任務 爬取城市天氣預報 105
一、項目背景 105
二、項目實現(xiàn) 106
三、程序代碼 110
練習 111
項目4 Python數(shù)據(jù)分析基礎(chǔ) 113
任務4.1 NumPy科學計算包 113
4.1.1 NumPy簡介與安裝 113
4.1.2 NumPy數(shù)組及其操作 114
4.1.3 NumPy數(shù)值計算 123
任務4.2 Pandas數(shù)據(jù)分析包 131
4.2.1 Pandas安裝 131
4.2.2 Series結(jié)構(gòu)及操作 131
4.2.3 DataFrame結(jié)構(gòu)及基本操作 140
4.2.4 DataFrame高級操作 148
任務4.3 Matplotlib數(shù)據(jù)可視化包 165
4.3.1 Matplotlib安裝 165
4.3.2 線圖 165
4.3.3 子圖 168
4.3.4 餅圖 170
4.3.5 散點圖 171
4.3.6 柱狀圖 172
4.3.7 DataFrame繪圖 174
綜合任務 學生成績分析 179
一、項目背景 179
二、項目實現(xiàn) 179
三、程序代碼 184
練習 186
項目5 Python機器學習基礎(chǔ) 188
任務5.1 機器學習簡介 188
5.1.1 機器學習概述 188
5.1.2 K-means聚類算法簡介 189
5.1.3 KNN分類算法簡介 195
5.1.4 線性回歸算法簡介 198
任務5.2 機器學習庫sklearn的應用 201
5.2.1 sklearn的安裝 201
5.2.2 K-means算法的應用 201
5.2.3 KNN算法的應用 204
5.2.4 線性回歸算法的應用 207
綜合任務 城市房價的預測 210
一、項目背景 210
二、項目實現(xiàn) 211
三、程序代碼 213
練習 214
參考文獻 216