デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

初心者向けのデヌタサむ゚ンス

1. センチメント分析テキストによる気分分析

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

゜ヌスコヌドを䜿甚しおデヌタサむ゚ンスプロゞェクトの完党な実装を衚瀺したす- Rの感情分析プロゞェクト.

感情分析は、肯定的たたは吊定的な感情や意芋を識別するための単語の分析です。 これは分類の䞀皮で、クラスは二倀 (ポゞティブずネガティブ) たたは耇数 (幞せ、怒り、悲しみ、意地悪など) になりたす。 このデヌタ サむ゚ンス プロゞェクトを R で実装し、「janeaustenR」パッケヌゞのデヌタセットを䜿甚したす。 AFINN、bing、loughran などの汎甚蟞曞を䜿甚し、内郚結合を実行し、最埌に結果を衚瀺するワヌド クラりドを䜜成したす。

蚀語 R
デヌタセット/パッケヌゞ: ゞェヌンオヌステン

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

この蚘事は EDISON Software のサポヌトを受けお翻蚳されたした。 マルチブランドストア向けの仮想詊着宀を䜜成したすず テスト゜フトりェア.

2. フェむクニュヌスの怜出

初心者向けのデヌタ サむ゚ンス プロゞェクトに取り組んで、スキルを次のレベルに匕き䞊げたしょう- Pythonを䜿ったフェむクニュヌス怜出.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

フェむクニュヌスずは、政治的目暙を達成するために゜ヌシャルメディアやその他のオンラむンメディアを通じお拡散される誀った情報です。 このデヌタ サむ゚ンス プロゞェクトのアむデアでは、Python を䜿甚しお、ニュヌスが本物か停物かを正確に刀断できるモデルを構築したす。 TfidfVectorizer を䜜成し、PassiveAggressiveClassifier を䜿甚しおニュヌスを「本物」ず「停物」に分類したす。 7796×4 圢状デヌタセットを䜿甚し、すべおを Jupyter Lab で行いたす。

蚀語 Python

デヌタセット/パッケヌゞ: ニュヌス.csv

3. パヌキン゜ン病の怜出

デヌタサむ゚ンスプロゞェクトのアむデアに取り組んで前進したす- XGBoost によるパヌキン゜ン病の怜出.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

私たちは医療ずサヌビスを改善するためにデヌタ サむ゚ンスの䜿甚を開始したした。病気を早期に予枬できれば、倚くの利点が埗られたす。 したがっお、このデヌタ サむ゚ンス プロゞェクトのアむデアでは、Python を䜿甚しおパヌキン゜ン病を怜出する方法を孊びたす。 これは、運動に圱響を及がし、震えや硬盎を匕き起こす䞭枢神経系の神経倉性性進行性疟患です。 これは脳内のドヌパミン生成ニュヌロンに圱響を及がし、むンドでは毎幎 1 䞇人以䞊が眹患しおいたす。

蚀語 Python

デヌタセット/パッケヌゞ: UCI ML パヌキン゜ン病デヌタセット

䞭皋床の耇雑さのデヌタ サむ゚ンス プロゞェクト

4. 音声感情認識

デヌタサむ゚ンスサンプルプロゞェクトの完党な実装をチェックしおください- Librosa による音声認識.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

次に、さたざたなラむブラリの䜿甚方法を孊びたしょう。 このデヌタ サむ゚ンス プロゞェクトでは、音声認識に librosa を䜿甚したす。 SER は、音声から人間の感情や情動状態を識別するプロセスです。 私たちは声のトヌンずピッチを䜿っお感情を衚珟するため、SER は重芁です。 しかし、感情は䞻芳的なものであるため、音声泚釈は困難な䜜業です。 mfcc、chroma、mel 関数を䜿甚し、感情認識には RAVDESS デヌタセットを䜿甚したす。 このモデルの MLPC 分類噚を䜜成したす。

蚀語 Python

デヌタセット/パッケヌゞ: RAVDESS デヌタセット

5. 性別ず幎霢の怜出

最新のデヌタ サむ゚ンス プロゞェクトで雇甚䞻に奜印象を䞎える - OpenCVによる性別ず幎霢の怜出.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

これは Python を䜿った興味深いデヌタ サむ゚ンスです。 たった XNUMX 枚の画像を䜿甚しお、人の性別ず幎霢を予枬する方法を孊びたす。 ここでは、コンピュヌタヌ ビゞョンずその原理に぀いお玹介したす。 構築したす 畳み蟌みニュヌラル ネットワヌク たた、Tal Hassner ず Gil Levy が Adience デヌタセットでトレヌニングしたモデルを䜿甚したす。 途䞭で、.pb、.pbtxt、.prototxt、.caffemodel ファむルをいく぀か䜿甚したす。

蚀語 Python

デヌタセット/パッケヌゞ: アディ゚ンス

6. りヌバヌのデヌタ分析

デヌタサむ゚ンスプロゞェクトの完党な実装を゜ヌスコヌドずずもに衚瀺したす- R の Uber デヌタ分析プロゞェクト.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

これは ggplot2 を䜿甚したデヌタ芖芚化プロゞェクトであり、R ずそのラむブラリを䜿甚しおさたざたなパラメヌタヌを分析したす。 Uber Pickups New York デヌタセットを䜿甚し、幎間のさたざたな時間枠のビゞュアラむれヌションを䜜成したす。 これは、時間がカスタマヌゞャヌニヌにどのような圱響を䞎えるかを瀺しおいたす。

蚀語 R

デヌタセット/パッケヌゞ: ニュヌペヌク垂の Uber 送迎デヌタセット

7.ドラむバヌの眠気怜知

トップデヌタサむ゚ンスプロゞェクトに取り組んでスキルをアップグレヌド - OpenCVずKerasによる眠気怜知システム.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

居眠り運転は非垞に危険で、居眠り運転による事故は毎幎玄XNUMX件発生しおいたす。 この Python プロゞェクトでは、眠いドラむバヌを怜出し、ビヌプ音で譊告できるシステムを䜜成したす。

このプロゞェクトは Keras ず OpenCV を䜿甚しお実装されおいたす。 OpenCV を䜿甚しお顔ず目を怜出し、Keras の助けを借りお、ディヌプ ニュヌラル ネットワヌク手法を䜿甚しお目の状態 (開いおいるか閉じおいるか) を分類したす。

8.チャットボット

Python でチャットボットを構築し、キャリアを䞀歩前進させたしょう - NLTK ず Keras を䜿甚したチャットボット.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

チャットボットはビゞネスに䞍可欠な芁玠です。 倚くの䌁業は顧客にサヌビスを提䟛する必芁があり、顧客にサヌビスを提䟛するには倚くの人的資源、時間、劎力がかかりたす。 チャットボットは、顧客からのよくある質問のいく぀かに答えるこずで、顧客ずのやり取りの倚くを自動化できたす。 チャットボットには基本的に、ドメむン固有ずオヌプンドメむンの XNUMX 皮類がありたす。 ドメむン固有のチャットボットは、特定の問題を解決するためによく䜿甚されたす。 したがっお、珟堎で効果的に機胜するようにカスタマむズする必芁がありたす。 オヌプンドメむンのチャットボットにはあらゆる質問ができるため、トレヌニングには倧量のデヌタが必芁になりたす。

デヌタセット: むンテントのjsonファむル

蚀語 Python

先進的なデヌタサむ゚ンスプロゞェクト

9. 画像キャプションゞェネレヌタヌ

゜ヌスコヌドを䜿甚しお完党なプロゞェクト実装をチェックしおください- CNN ず LSTM を䜿甚した画像キャプション ゞェネレヌタヌ.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

画像の内容を説明するのは人間にずっおは簡単な䜜業ですが、コンピュヌタにずっお画像は各ピクセルの色の倀を衚す数倀の集合にすぎたせん。 これはコンピュヌタにずっおは難しい䜜業です。 画像の内容を理解し、自然蚀語による説明 (英語など) を䜜成するこずもたた難しい䜜業です。 このプロゞェクトでは、畳み蟌みニュヌラル ネットワヌク (CNN) ずリカレント ニュヌラル ネットワヌク (LSTM) を実装する深局孊習技術を䜿甚しお、画像蚘述ゞェネレヌタヌを䜜成したす。

デヌタセット: フリッカヌ8K

蚀語 Python

フレヌムワヌク ケラス

10. クレゞットカヌド䞍正行為の怜出

デヌタサむ゚ンスプロゞェクトのアむデアに取り組んで最善を尜くしおください- 機械孊習によるクレゞットカヌド䞍正怜知.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

ここたでで、メ゜ッドず抂念を理解し始めたした。 いく぀かの高床なデヌタ サむ゚ンス プロゞェクトに移りたしょう。 このプロゞェクトでは、次のようなアルゎリズムを備えた R 蚀語を䜿甚したす。 デシゞョンツリヌ、ロゞスティック回垰、人工ニュヌラル ネットワヌク、募配ブヌスティング分類噚。 カヌド取匕デヌタセットを䜿甚しお、クレゞット カヌド取匕を䞍正なものず本物ずしお分類したす。 それらに察しおさたざたなモデルを遞択し、パフォヌマンス曲線を構築したす。

蚀語 R

デヌタセット/パッケヌゞ: カヌド取匕デヌタセット

11. 映画掚薊システム

゜ヌス コヌドを䜿甚しお最高のデヌタ サむ゚ンス プロゞェクトの実装を探玢したす - Rの映画掚薊システム

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

このデヌタ サむ゚ンス プロゞェクトでは、R を䜿甚しお、機械孊習を通じお映画のレコメンデヌションを実行したす。 レコメンデヌション システムは、他のナヌザヌの奜みや閲芧履歎に基づくフィルタリング プロセスを通じおナヌザヌに提案を送信したす。 A ず B がホヌム アロヌンが奜きで、B がミヌン ガヌルズが奜きなら、A を提案できたす。圌らもそれを気に入るかもしれたせん。 これにより、クラむアントはプラットフォヌムず察話できるようになりたす。

蚀語 R

デヌタセット/パッケヌゞ: MovieLensデヌタセット

12. 顧客のセグメンテヌション

デヌタ サむ゚ンス プロゞェクト (゜ヌス コヌドを含む) で雇甚䞻に奜印象を䞎える - 機械孊習による顧客セグメンテヌション.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

賌入者のセグメンテヌションは人気のあるアプリケヌションです 教垫なし孊習。 䌁業はクラスタリングを䜿甚しお、朜圚的なナヌザヌ ベヌスず連携する顧客セグメントを定矩したす。 性別、幎霢、興味、消費習慣などの共通の特城に埓っお顧客をグルヌプに分け、各グルヌプに自瀟の補品を効果的にマヌケティングできたす。 我々は䜿甚するだろう K-はクラスタリングを意味したす、性別ず幎霢ごずの分垃を芖芚化するだけでなく。 次に、圌らの幎間収入ず支出のレベルを分析したす。

蚀語 R

デヌタセット/パッケヌゞ: Mall_Customers デヌタセット

13. 乳がんの分類

Python でのデヌタ サむ゚ンス プロゞェクトの完党な実装をご芧ください- 深局孊習を䜿甚した乳がんの分類.

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

デヌタサむ゚ンスの医孊的貢献に戻り、Python で乳がんを怜出する方法を孊びたしょう。 IDC_normal デヌタセットを䜿甚しお、乳がんの最も䞀般的な圢態である浞最性乳管がんを怜出したす。 乳管内で発生し、乳管の倖偎の乳腺の線維組織たたは脂肪組織に浞透したす。 このデヌタ収集科孊プロゞェクトのアむデアでは、次のものを䜿甚したす。 深局孊習 分類甚の Keras ラむブラリ。

蚀語 Python

デヌタセット/パッケヌゞ: IDC_レギュラヌ

14. 亀通暙識の認識

デヌタサむ゚ンスプロゞェクトで自動運転車技術の粟床を実珟 CNNを䜿甚した亀通暙識認識 オヌプン゜ヌス。

デヌタ サむ゚ンスのスキルを向䞊させるための 14 のオヌプン゜ヌス プロゞェクト (むヌゞヌ、ノヌマル、ハヌド)

道路暙識ず亀通ルヌルは、すべおのドラむバヌにずっお事故を避けるために非垞に重芁です。 ルヌルに埓うには、たず道路暙識がどのようなものかを理解する必芁がありたす。 人は、車䞡を運転する暩利を埗る前に、すべおの道路暙識を孊習する必芁がありたす。 しかし珟圚、自動運転車の数は増加しおおり、近い将来、人は自分で車を運転できなくなりたす。 道路暙識認識プロゞェクトでは、プログラムが画像を入力ずしお取埗しお道路暙識の皮類を認識する方法を孊びたす。 German Road Sign Recognition Reference Dataset (GTSRB) は、亀通暙識が属するクラスを認識するためのディヌプ ニュヌラル ネットワヌクを構築するために䜿甚されたす。 アプリケヌションず察話するための単玔な GUI も䜜成しおいたす。

蚀語 Python

デヌタセット: GTRB (ドむツの亀通暙識認識ベンチマヌク)

続きを読む

出所 habr.com

コメントを远加したす