ชุดข้อมูลลูกค้าห้างสรรพสินค้า — ข้อมูลของผู้เยี่ยมชมร้านค้า: id, เพศ, อายุ, รายได้, คะแนนการใช้จ่าย (ตัวเลือกการสมัคร:โครงการแบ่งส่วนลูกค้าด้วยการเรียนรู้ของเครื่อง )ชุดข้อมูลไอริส — ชุดข้อมูลสำหรับผู้เริ่มต้น ซึ่งมีขนาดกลีบเลี้ยงและกลีบดอกไม้ต่างๆชุดข้อมูล MNIST — ชุดข้อมูลตัวเลขที่เขียนด้วยลายมือ ภาพการฝึกอบรม 60 ภาพและภาพทดสอบ 000 ภาพชุดข้อมูลที่อยู่อาศัยบอสตัน เป็นชุดข้อมูลยอดนิยมสำหรับการจดจำรูปแบบ ประกอบด้วยข้อมูลเกี่ยวกับบ้านในบอสตัน: จำนวนอพาร์ทเมนท์ ราคาเช่า ดัชนีอาชญากรรมชุดข้อมูลการตรวจจับข่าวปลอม — มี 7796 รายการพร้อมเครื่องหมายข่าว: จริงหรือเท็จ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python:โครงการ Python ตรวจจับข่าวปลอม )ชุดข้อมูลคุณภาพไวน์ — มีข้อมูลเกี่ยวกับไวน์: 4898 บันทึกพร้อมพารามิเตอร์ 14 ตัวข้อมูล SOCR – ชุดข้อมูลส่วนสูงและน้ำหนัก - ตัวเลือกที่ดีในการเริ่มต้น มี 25 บันทึกส่วนสูงและน้ำหนักของคนอายุ 000 ปี
บทความนี้ได้รับการแปลโดยได้รับการสนับสนุนจาก EDISON Software ซึ่งตอบสนองออเดอร์จากจีนตอนใต้ “ดีเยี่ยม” และพัฒนาเว็บแอพพลิเคชั่นและเว็บไซต์ .ชุดข้อมูลพาร์กินสัน — บันทึกผู้ป่วยโรคพาร์กินสัน 195 รายการ พร้อมพารามิเตอร์การวิเคราะห์ 25 รายการ สามารถใช้ประเมินความแตกต่างเบื้องต้นระหว่างคนป่วยและคนที่มีสุขภาพดีได้ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python:โครงการการเรียนรู้ของเครื่องเพื่อตรวจหาโรคพาร์กินสัน )ชุดข้อมูลไททานิค — มีข้อมูลเกี่ยวกับผู้โดยสาร (อายุ เพศ ญาติบนเครื่อง ฯลฯ) 891 คนในชุดฝึกอบรม และ 418 คนในชุดทดสอบชุดข้อมูลการรับของ Uber - ข้อมูลการเดินทางบน Uber 4.5 ล้านครั้งในปี 2014 และ 14 ล้านครั้งในปี 2015 (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน R:โครงการวิเคราะห์ข้อมูล Uber ใน R )ชุดข้อมูล Chars74k — มีรูปภาพสัญลักษณ์อังกฤษและแคนาดา 64 คลาส: 0-9, AZ, az 7700 ภาพที่เป็นธรรมชาติ 7.7k, เขียนด้วยลายมือ 3400k, แบบอักษรสังเคราะห์จากคอมพิวเตอร์ 62000 ตัวชุดข้อมูลการตรวจจับการฉ้อโกงบัตรเครดิต — มีข้อมูลเกี่ยวกับธุรกรรมของบัตรเครดิตที่ถูกบุกรุก (ตัวเลือกแอปพลิเคชันพร้อมแหล่งที่มา:โครงการเรียนรู้เครื่องตรวจจับการฉ้อโกงบัตรเครดิต )ชุดข้อมูล Intent ของ Chatbot — ไฟล์ JSON ที่มีแท็กต่างๆ เช่น คำทักทาย ลาก่อน Hospital_search pharmacy_search ฯลฯ ประกอบด้วยชุดเทมเพลตคำถาม-คำตอบ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python:โครงการ Chatbot ใน Python )ชุดข้อมูลอีเมล Enron — ประกอบด้วยจดหมายครึ่งล้านฉบับจากผู้จัดการของ Enron 150 คนชุดข้อมูล Yelp — มีคำแนะนำ 1,2 ล้านรายการจากผู้ใช้ 1,6 ล้านคนจากองค์กร 1,2 ล้านแห่งชุดข้อมูลอันตราย — บันทึกคำถามและคำตอบมากกว่า 200 รายการจากเกมโทรทัศน์ยอดนิยมชุดข้อมูลระบบผู้แนะนำ — พอร์ทัลที่รวบรวมชุดข้อมูลจาก UCSD University มีบันทึกบทวิจารณ์บนเว็บไซต์ยอดนิยม (Goodreads, Amazon) เหมาะสำหรับการสร้างระบบผู้แนะนำ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน R:โครงการระบบแนะนำภาพยนตร์ในร )ชุดข้อมูลสแปมเบส UCI — ชุดข้อมูลการฝึกอบรมสำหรับการตรวจจับสแปม ประกอบด้วยตัวอักษร 4601 ตัวพร้อมพารามิเตอร์เมตาดาต้า 57 รายการชุดข้อมูล Flickr 30k — รูปภาพและคำบรรยายมากกว่า 30 รายการ (ชุดข้อมูล Flickr 8k — 8000 ภาพ โปรเจ็กต์ซอร์ส Python:โครงการ Python ตัวสร้างคำบรรยายภาพ )ความคิดเห็นของ ไอเอ็มดีบี — บทวิจารณ์ภาพยนตร์ 25 รายการในชุดฝึกอบรม และ 000 รายการในชุดทดสอบ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน R:โครงการวิทยาศาสตร์ข้อมูลการวิเคราะห์ความรู้สึก )ชุดข้อมูล MS COCO — 1,5 ล้านภาพที่แท็กชุดข้อมูล CIFAR-10 และ CIFAR-100 — CIFAR-10 มีรูปภาพขนาดเล็ก 60,000*32 พิกเซลหมายเลข 32-0 จำนวน 9 ภาพ CIFAR-100 - ตามลำดับ 0-100ชุดข้อมูล GTSRB (เกณฑ์มาตรฐานการรู้จำเครื่องหมายจราจรของเยอรมัน) — 50 ภาพจาก 000 ป้ายถนน (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python:โครงการ Python จดจำป้ายจราจร )ชุดข้อมูล ImageNet — มีมากกว่า 100 วลีและประมาณ 000 ภาพต่อวลีชุดข้อมูลรูปภาพทางจุลพยาธิวิทยาเต้านม — ชุดข้อมูลประกอบด้วยภาพตัวอย่างมะเร็งเต้านม (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดเปิดอยู่โครงการงูหลามจำแนกมะเร็งเต้านม )ชุดข้อมูลทิวทัศน์เมือง — มีคำอธิบายประกอบคุณภาพสูงของลำดับวิดีโอของถนนในเมืองต่างๆชุดข้อมูลจลนศาสตร์ - มีลิงก์ URL ไปยังวิดีโอคุณภาพสูงประมาณ 6,5 ล้านรายการชุดข้อมูลท่าทางมนุษย์ MPII — ชุดข้อมูลประกอบด้วยภาพท่าทางของมนุษย์ 25 ภาพพร้อมคำอธิบายประกอบร่วมชุดข้อมูล 20BN-บางอย่าง-บางอย่าง เวอร์ชัน 2 - ชุดวิดีโอคุณภาพสูงที่แสดงให้เห็นว่าบุคคลดำเนินการอย่างไรชุดข้อมูล Object 365 — ชุดข้อมูลภาพคุณภาพสูงพร้อมกล่องขอบวัตถุชุดข้อมูลการร่างภาพ — มีรูปภาพมากกว่า 1000 ภาพพร้อมภาพวาดโครงร่างชุดข้อมูล CQ500 - ชุดข้อมูลประกอบด้วยการสแกน CT ของศีรษะ 491 ครั้ง และชิ้น 193 ชิ้นชุดข้อมูล IMDB-Wiki — ชุดข้อมูลที่มีรูปภาพใบหน้ามากกว่า 5 ล้านรูปภาพที่ทำเครื่องหมายตามเพศและอายุ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดเปิดอยู่โครงการ Python การตรวจจับเพศและอายุ )ชุดข้อมูล Youtube 8M - ชุดข้อมูลวิดีโอที่มีป้ายกำกับซึ่งมีรหัสวิดีโอ Youtube 6,1 ล้านรหัสชุดข้อมูล Urban Sound 8K — ชุดข้อมูลเสียงในเมือง (ประกอบด้วย 8732 เสียงในเมืองจาก 10 คลาส)ชุดข้อมูล LSUN - ชุดข้อมูลของภาพสีนับล้านของฉากและวัตถุ (ประมาณ 59 ล้านภาพ 10 หมวดหมู่ฉากที่แตกต่างกัน และ 20 หมวดหมู่วัตถุที่แตกต่างกัน)ชุดข้อมูล RAVDESS — ฐานข้อมูลภาพและเสียงของคำพูดทางอารมณ์ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดเปิดอยู่โครงการ Python การรู้จำอารมณ์คำพูด )ชุดข้อมูล Librispeech — ชุดข้อมูลประกอบด้วยคำพูดภาษาอังกฤษ 1000 ชั่วโมงพร้อมสำเนียงที่แตกต่างกันชุดข้อมูล Baidu Apolloscape — ชุดข้อมูลสำหรับการพัฒนาเทคโนโลยีการขับขี่ด้วยตนเองพอร์ทัลข้อมูล Quandl — พื้นที่เก็บข้อมูลเศรษฐกิจและการเงิน (มีเนื้อหาฟรีและจ่ายเงิน)พอร์ทัลข้อมูลเปิดของธนาคารโลก — ข้อมูลเกี่ยวกับเงินกู้ที่ออกโดยธนาคารโลกให้กับประเทศกำลังพัฒนาพอร์ทัลข้อมูลของกองทุนการเงินระหว่างประเทศ เป็นพอร์ทัลกองทุนการเงินระหว่างประเทศที่เผยแพร่ข้อมูลเกี่ยวกับการเงินระหว่างประเทศ อัตราหนี้ การลงทุน ทุนสำรองเงินตราต่างประเทศ และสินค้าโภคภัณฑ์พอร์ทัลข้อมูลสมาคมเศรษฐกิจอเมริกัน (AEA) - แหล่งข้อมูลสำหรับการค้นหาข้อมูลเศรษฐกิจมหภาคของสหรัฐอเมริกาพอร์ทัลข้อมูลของ Google เทรนด์ - ข้อมูลเทรนด์ของ Google สามารถใช้เพื่อสำรวจและวิเคราะห์ข้อมูลด้วยภาพพอร์ทัลข้อมูลตลาด Financial Times เป็นแหล่งข้อมูลที่ทันสมัยเกี่ยวกับตลาดการเงินจากทั่วโลกพอร์ทัล Data.gov - พอร์ทัลข้อมูลแบบเปิดของรัฐบาลสหรัฐฯ (การเกษตร สุขภาพ ภูมิอากาศ การศึกษา พลังงาน การเงิน วิทยาศาสตร์และการวิจัย ฯลฯ)พอร์ทัลข้อมูล: ข้อมูลรัฐบาลแบบเปิด (อินเดีย) เป็นแพลตฟอร์มข้อมูลรัฐบาลแบบเปิดของอินเดียสภาพแวดล้อมทางอาหาร Atlas Data Portal — มีข้อมูลการวิจัยด้านโภชนาการในประเทศสหรัฐอเมริกาพอร์ทัลข้อมูลด้านสุขภาพ เป็นพอร์ทัลของกระทรวงสาธารณสุขและบริการมนุษย์ของสหรัฐอเมริกาพอร์ทัลข้อมูลศูนย์ควบคุมและป้องกันโรค - มีข้อมูลที่เกี่ยวข้องกับสุขภาพที่หลากหลายพอร์ทัล Datastore ลอนดอน - ข้อมูลเกี่ยวกับชีวิตของผู้คนในลอนดอนพอร์ทัลข้อมูลเปิดของรัฐบาลแคนาดา - พอร์ทัลข้อมูลแบบเปิดเกี่ยวกับชาวแคนาดา (เกษตรกรรม ศิลปะ ดนตรี การศึกษา รัฐบาล การดูแลสุขภาพ ฯลฯ)
อ่านเพิ่มเติม
14 โครงการโอเพ่นซอร์สเพื่อพัฒนาทักษะวิทยาศาสตร์ข้อมูลของคุณ (ง่าย ปกติ ยาก) โดโจส่วนหน้า: โครงการเพื่อฝึกฝนทักษะของนักพัฒนา (5 ใหม่ + 43 เก่า) อินโฟกราฟิกไดนามิกไอทีที่น่าสนใจที่สุด 12 อันดับแรก
ที่มา: will.com