教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

全部 Python+大數(shù)據(jù)新聞動(dòng)態(tài) Python+大數(shù)據(jù)技術(shù)文章 Python+大數(shù)據(jù)學(xué)習(xí)常見問題 技術(shù)問答

    • JsonPath基本語法介紹:JsonPath用法詳解

      JSONPath是一種信息抽取類庫,是從JSON文檔中抽取指定信息的工具,提供多種語言實(shí)現(xiàn)版本,包括Javascript、Python、PHP和Java。 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-27 |傳智教育 |JsonPath基本語法

    • 如何理解單繼承?單繼承的語法格式介紹

      被繼承的類稱為父類或基類,繼承的類稱為子類或派生類。子類在繼承父類時(shí),會(huì)自動(dòng)擁有父類中的方法和屬性。單繼承指的是子類只繼承一個(gè)父類,其語法格式如下: 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-27 |傳智教育 |單繼承,單繼承的語法格式

    • MySQL的隔離級(jí)別包含哪些內(nèi)容?

      MySQL數(shù)據(jù)庫事務(wù)的基本性質(zhì)為ACID即原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)和持久性(Durability)。接下來就來了解一下各種特性的內(nèi)容: 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-26 |傳智教育 |MySQL的隔離級(jí)別包含哪些內(nèi)容?

    • Hadoop如何實(shí)現(xiàn)二次排序?【大數(shù)據(jù)面試題】

      有兩種方法可以進(jìn)行二次排序,分別為:buffer and in memory sort和 value-to-key conversion。buffer and in memory sort的主要思想是:在reduce()函數(shù)中,將某個(gè)key對(duì)應(yīng)的所有value保存到內(nèi)存中,然后進(jìn)行排序。 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-26 |傳智教育 |Hadoop實(shí)現(xiàn)二次排序

    • 寫爬蟲是用多進(jìn)程好?還是多線程好?

      一般情況下,在選擇是使用多進(jìn)程還是多線程時(shí),主要考慮的業(yè)務(wù)到底是IO密集型(多線程)還是計(jì)算密集型(多進(jìn)程)。在爬蟲中,請(qǐng)求的并發(fā)業(yè)務(wù)屬于是網(wǎng)絡(luò)的IO類型業(yè)務(wù),因此網(wǎng)絡(luò)并發(fā)適宜使用多線程;但特殊需求下,比如使用phantomjs 或者chrome-headless來抓取的爬蟲,應(yīng)當(dāng)是多進(jìn)程的,因?yàn)槊恳粋€(gè)phan/chro實(shí)例就是一個(gè)進(jìn)程了,并發(fā)只能是多進(jìn)程。 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-21 |傳智教育 |寫爬蟲是用多進(jìn)程好,多線程

    • Python爬取數(shù)據(jù)后使用哪個(gè)數(shù)據(jù)庫存儲(chǔ)數(shù)據(jù)比較好?

      一般爬蟲使用的數(shù)據(jù)庫,是根據(jù)項(xiàng)目來定的。如需求方指定了使用什么數(shù)據(jù)庫、如果沒指定,那么決定權(quán)就在爬蟲程序員手里,如果自選的話,mysql 和mongodb 用的都是比較多的。但不同的數(shù)據(jù)庫品種有各自的優(yōu)缺點(diǎn),不同的場(chǎng)景任何一種數(shù)據(jù)庫都可以用來存儲(chǔ),但是某種可能會(huì)更好。比如如果抓取的數(shù)據(jù)之間的耦合性很高,關(guān)系比較復(fù)雜的話,那么mysql可能會(huì)是更好的選擇。如果抓取的數(shù)據(jù)是分版塊的,并且它們之間沒有相似性或關(guān)聯(lián)性不強(qiáng),那么可能mongodb 會(huì)更好。 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-21 |傳智教育 |Python爬取數(shù)據(jù)用哪個(gè)數(shù)據(jù)庫存儲(chǔ)數(shù)據(jù)好

    • 什么是事實(shí)表和維度表?【數(shù)據(jù)倉庫】

      每個(gè)數(shù)據(jù)倉庫都包含一個(gè)或者多個(gè)事實(shí)數(shù)據(jù)表,事實(shí)表是對(duì)分析主題的度量,它包含了與各維度表相關(guān)聯(lián)的外鍵,并通過連接(Join)方式與維度表關(guān)聯(lián)。 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-21 |傳智教育 |什么是事實(shí)表和維度表

    • Spark處理數(shù)據(jù)的速度比Hive更快?原因是什么?

      Spark SQL比Hadoop Hive快,是有一定條件的,而且不是Spark SQL的引擎比Hive的引擎快,相反,Hive的HQL引擎還比Spark SQL的引擎更快。其實(shí),關(guān)鍵還是在于Spark 本身快。那么Spark為什么快呢? 查看全文>>

      Python+大數(shù)據(jù)技術(shù)文章2021-05-20 |傳智教育 |Spark處理數(shù)據(jù),Hive,大數(shù)據(jù)面試題

    << < 1 ... 35 36 37 38 39 40 41 ... 106 > >>
和我們?cè)诰€交談!