ชุดข้อมูล 52 ชุดสำหรับโครงการฝึกอบรม

  1. ชุดข้อมูลลูกค้าห้างสรรพสินค้า — ข้อมูลของผู้เยี่ยมชมร้านค้า: id, เพศ, อายุ, รายได้, คะแนนการใช้จ่าย (ตัวเลือกการสมัคร: โครงการแบ่งส่วนลูกค้าด้วยการเรียนรู้ของเครื่อง)
  2. ชุดข้อมูลไอริส — ชุดข้อมูลสำหรับผู้เริ่มต้น ซึ่งมีขนาดกลีบเลี้ยงและกลีบดอกไม้ต่างๆ
  3. ชุดข้อมูล MNIST — ชุดข้อมูลตัวเลขที่เขียนด้วยลายมือ ภาพการฝึกอบรม 60 ภาพและภาพทดสอบ 000 ภาพ
  4. ชุดข้อมูลที่อยู่อาศัยบอสตัน เป็นชุดข้อมูลยอดนิยมสำหรับการจดจำรูปแบบ ประกอบด้วยข้อมูลเกี่ยวกับบ้านในบอสตัน: จำนวนอพาร์ทเมนท์ ราคาเช่า ดัชนีอาชญากรรม
  5. ชุดข้อมูลการตรวจจับข่าวปลอม — มี 7796 รายการพร้อมเครื่องหมายข่าว: จริงหรือเท็จ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python: โครงการ Python ตรวจจับข่าวปลอม )
  6. ชุดข้อมูลคุณภาพไวน์ — มีข้อมูลเกี่ยวกับไวน์: 4898 บันทึกพร้อมพารามิเตอร์ 14 ตัว
  7. ข้อมูล SOCR – ชุดข้อมูลส่วนสูงและน้ำหนัก - ตัวเลือกที่ดีในการเริ่มต้น มี 25 บันทึกส่วนสูงและน้ำหนักของคนอายุ 000 ปี

    ชุดข้อมูล 52 ชุดสำหรับโครงการฝึกอบรม

    บทความนี้ได้รับการแปลโดยได้รับการสนับสนุนจาก EDISON Software ซึ่ง ตอบสนองออเดอร์จากจีนตอนใต้ “ดีเยี่ยม”และ พัฒนาเว็บแอพพลิเคชั่นและเว็บไซต์.

  8. ชุดข้อมูลพาร์กินสัน — บันทึกผู้ป่วยโรคพาร์กินสัน 195 รายการ พร้อมพารามิเตอร์การวิเคราะห์ 25 รายการ สามารถใช้ประเมินความแตกต่างเบื้องต้นระหว่างคนป่วยและคนที่มีสุขภาพดีได้ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python: โครงการการเรียนรู้ของเครื่องเพื่อตรวจหาโรคพาร์กินสัน)
  9. ชุดข้อมูลไททานิค — มีข้อมูลเกี่ยวกับผู้โดยสาร (อายุ เพศ ญาติบนเครื่อง ฯลฯ) 891 คนในชุดฝึกอบรม และ 418 คนในชุดทดสอบ
  10. ชุดข้อมูลการรับของ Uber - ข้อมูลการเดินทางบน Uber 4.5 ล้านครั้งในปี 2014 และ 14 ล้านครั้งในปี 2015 (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน R: โครงการวิเคราะห์ข้อมูล Uber ใน R)
  11. ชุดข้อมูล Chars74k — มีรูปภาพสัญลักษณ์อังกฤษและแคนาดา 64 คลาส: 0-9, AZ, az 7700 ภาพที่เป็นธรรมชาติ 7.7k, เขียนด้วยลายมือ 3400k, แบบอักษรสังเคราะห์จากคอมพิวเตอร์ 62000 ตัว
  12. ชุดข้อมูลการตรวจจับการฉ้อโกงบัตรเครดิต — มีข้อมูลเกี่ยวกับธุรกรรมของบัตรเครดิตที่ถูกบุกรุก (ตัวเลือกแอปพลิเคชันพร้อมแหล่งที่มา: โครงการเรียนรู้เครื่องตรวจจับการฉ้อโกงบัตรเครดิต)
  13. ชุดข้อมูล Intent ของ Chatbot — ไฟล์ JSON ที่มีแท็กต่างๆ เช่น คำทักทาย ลาก่อน Hospital_search pharmacy_search ฯลฯ ประกอบด้วยชุดเทมเพลตคำถาม-คำตอบ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python: โครงการ Chatbot ใน Python)
  14. ชุดข้อมูลอีเมล Enron — ประกอบด้วยจดหมายครึ่งล้านฉบับจากผู้จัดการของ Enron 150 คน
  15. ชุดข้อมูล Yelp — มีคำแนะนำ 1,2 ล้านรายการจากผู้ใช้ 1,6 ล้านคนจากองค์กร 1,2 ล้านแห่ง
  16. ชุดข้อมูลอันตราย — บันทึกคำถามและคำตอบมากกว่า 200 รายการจากเกมโทรทัศน์ยอดนิยม
  17. ชุดข้อมูลระบบผู้แนะนำ — พอร์ทัลที่รวบรวมชุดข้อมูลจาก UCSD University มีบันทึกบทวิจารณ์บนเว็บไซต์ยอดนิยม (Goodreads, Amazon) เหมาะสำหรับการสร้างระบบผู้แนะนำ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน R: โครงการระบบแนะนำภาพยนตร์ในร )
  18. ชุดข้อมูลสแปมเบส UCI — ชุดข้อมูลการฝึกอบรมสำหรับการตรวจจับสแปม ประกอบด้วยตัวอักษร 4601 ตัวพร้อมพารามิเตอร์เมตาดาต้า 57 รายการ
  19. ชุดข้อมูล Flickr 30k — รูปภาพและคำบรรยายมากกว่า 30 รายการ (ชุดข้อมูล Flickr 8k — 8000 ภาพ โปรเจ็กต์ซอร์ส Python: โครงการ Python ตัวสร้างคำบรรยายภาพ)
  20. ความคิดเห็นของ ไอเอ็มดีบี — บทวิจารณ์ภาพยนตร์ 25 รายการในชุดฝึกอบรม และ 000 รายการในชุดทดสอบ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน R: โครงการวิทยาศาสตร์ข้อมูลการวิเคราะห์ความรู้สึก)
  21. ชุดข้อมูล MS COCO — 1,5 ล้านภาพที่แท็ก
  22. ชุดข้อมูล CIFAR-10 และ CIFAR-100 — CIFAR-10 มีรูปภาพขนาดเล็ก 60,000*32 พิกเซลหมายเลข 32-0 จำนวน 9 ภาพ CIFAR-100 - ตามลำดับ 0-100
  23. ชุดข้อมูล GTSRB (เกณฑ์มาตรฐานการรู้จำเครื่องหมายจราจรของเยอรมัน) — 50 ภาพจาก 000 ป้ายถนน (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดใน Python: โครงการ Python จดจำป้ายจราจร)
  24. ชุดข้อมูล ImageNet — มีมากกว่า 100 วลีและประมาณ 000 ภาพต่อวลี
  25. ชุดข้อมูลรูปภาพทางจุลพยาธิวิทยาเต้านม — ชุดข้อมูลประกอบด้วยภาพตัวอย่างมะเร็งเต้านม (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดเปิดอยู่ โครงการงูหลามจำแนกมะเร็งเต้านม)
  26. ชุดข้อมูลทิวทัศน์เมือง — มีคำอธิบายประกอบคุณภาพสูงของลำดับวิดีโอของถนนในเมืองต่างๆ
  27. ชุดข้อมูลจลนศาสตร์ - มีลิงก์ URL ไปยังวิดีโอคุณภาพสูงประมาณ 6,5 ล้านรายการ
  28. ชุดข้อมูลท่าทางมนุษย์ MPII — ชุดข้อมูลประกอบด้วยภาพท่าทางของมนุษย์ 25 ภาพพร้อมคำอธิบายประกอบร่วม
  29. ชุดข้อมูล 20BN-บางอย่าง-บางอย่าง เวอร์ชัน 2 - ชุดวิดีโอคุณภาพสูงที่แสดงให้เห็นว่าบุคคลดำเนินการอย่างไร
  30. ชุดข้อมูล Object 365 — ชุดข้อมูลภาพคุณภาพสูงพร้อมกล่องขอบวัตถุ
  31. ชุดข้อมูลการร่างภาพ — มีรูปภาพมากกว่า 1000 ภาพพร้อมภาพวาดโครงร่าง
  32. ชุดข้อมูล CQ500 - ชุดข้อมูลประกอบด้วยการสแกน CT ของศีรษะ 491 ครั้ง และชิ้น 193 ชิ้น
  33. ชุดข้อมูล IMDB-Wiki — ชุดข้อมูลที่มีรูปภาพใบหน้ามากกว่า 5 ล้านรูปภาพที่ทำเครื่องหมายตามเพศและอายุ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดเปิดอยู่ โครงการ Python การตรวจจับเพศและอายุ)
  34. ชุดข้อมูล Youtube 8M - ชุดข้อมูลวิดีโอที่มีป้ายกำกับซึ่งมีรหัสวิดีโอ Youtube 6,1 ล้านรหัส
  35. ชุดข้อมูล Urban Sound 8K — ชุดข้อมูลเสียงในเมือง (ประกอบด้วย 8732 เสียงในเมืองจาก 10 คลาส)
  36. ชุดข้อมูล LSUN - ชุดข้อมูลของภาพสีนับล้านของฉากและวัตถุ (ประมาณ 59 ล้านภาพ 10 หมวดหมู่ฉากที่แตกต่างกัน และ 20 หมวดหมู่วัตถุที่แตกต่างกัน)
  37. ชุดข้อมูล RAVDESS — ฐานข้อมูลภาพและเสียงของคำพูดทางอารมณ์ (ตัวเลือกแอปพลิเคชันพร้อมซอร์สโค้ดเปิดอยู่ โครงการ Python การรู้จำอารมณ์คำพูด)
  38. ชุดข้อมูล Librispeech — ชุดข้อมูลประกอบด้วยคำพูดภาษาอังกฤษ 1000 ชั่วโมงพร้อมสำเนียงที่แตกต่างกัน
  39. ชุดข้อมูล Baidu Apolloscape — ชุดข้อมูลสำหรับการพัฒนาเทคโนโลยีการขับขี่ด้วยตนเอง
  40. พอร์ทัลข้อมูล Quandl — พื้นที่เก็บข้อมูลเศรษฐกิจและการเงิน (มีเนื้อหาฟรีและจ่ายเงิน)
  41. พอร์ทัลข้อมูลเปิดของธนาคารโลก — ข้อมูลเกี่ยวกับเงินกู้ที่ออกโดยธนาคารโลกให้กับประเทศกำลังพัฒนา
  42. พอร์ทัลข้อมูลของกองทุนการเงินระหว่างประเทศ เป็นพอร์ทัลกองทุนการเงินระหว่างประเทศที่เผยแพร่ข้อมูลเกี่ยวกับการเงินระหว่างประเทศ อัตราหนี้ การลงทุน ทุนสำรองเงินตราต่างประเทศ และสินค้าโภคภัณฑ์
  43. พอร์ทัลข้อมูลสมาคมเศรษฐกิจอเมริกัน (AEA) - แหล่งข้อมูลสำหรับการค้นหาข้อมูลเศรษฐกิจมหภาคของสหรัฐอเมริกา
  44. พอร์ทัลข้อมูลของ Google เทรนด์ - ข้อมูลเทรนด์ของ Google สามารถใช้เพื่อสำรวจและวิเคราะห์ข้อมูลด้วยภาพ
  45. พอร์ทัลข้อมูลตลาด Financial Times เป็นแหล่งข้อมูลที่ทันสมัยเกี่ยวกับตลาดการเงินจากทั่วโลก
  46. พอร์ทัล Data.gov - พอร์ทัลข้อมูลแบบเปิดของรัฐบาลสหรัฐฯ (การเกษตร สุขภาพ ภูมิอากาศ การศึกษา พลังงาน การเงิน วิทยาศาสตร์และการวิจัย ฯลฯ)
  47. พอร์ทัลข้อมูล: ข้อมูลรัฐบาลแบบเปิด (อินเดีย) เป็นแพลตฟอร์มข้อมูลรัฐบาลแบบเปิดของอินเดีย
  48. สภาพแวดล้อมทางอาหาร Atlas Data Portal — มีข้อมูลการวิจัยด้านโภชนาการในประเทศสหรัฐอเมริกา
  49. พอร์ทัลข้อมูลด้านสุขภาพ เป็นพอร์ทัลของกระทรวงสาธารณสุขและบริการมนุษย์ของสหรัฐอเมริกา
  50. พอร์ทัลข้อมูลศูนย์ควบคุมและป้องกันโรค - มีข้อมูลที่เกี่ยวข้องกับสุขภาพที่หลากหลาย
  51. พอร์ทัล Datastore ลอนดอน - ข้อมูลเกี่ยวกับชีวิตของผู้คนในลอนดอน
  52. พอร์ทัลข้อมูลเปิดของรัฐบาลแคนาดา - พอร์ทัลข้อมูลแบบเปิดเกี่ยวกับชาวแคนาดา (เกษตรกรรม ศิลปะ ดนตรี การศึกษา รัฐบาล การดูแลสุขภาพ ฯลฯ)

อ่านเพิ่มเติม

ที่มา: will.com

เพิ่มความคิดเห็น