สถานที่เต็ม

  • คำอธิบาย :

ชุดข้อมูล Places ได้รับการออกแบบตามหลักการการรับรู้ภาพของมนุษย์ เป้าหมายของเราคือการสร้างแกนกลางของความรู้ด้านภาพที่สามารถใช้ในการฝึกอบรมระบบเทียมสำหรับงานความเข้าใจภาพระดับสูง เช่น บริบทของฉาก การจดจำวัตถุ การคาดเดาการกระทำและเหตุการณ์ และการอนุมานทฤษฎีของจิตใจ

หมวดหมู่เชิงความหมายของ Places ถูกกำหนดโดยฟังก์ชัน: ป้ายกำกับแสดงถึงระดับเริ่มต้นของสภาพแวดล้อม เพื่อแสดงให้เห็น ชุดข้อมูลมีหมวดหมู่ของห้องนอนหรือถนนที่แตกต่างกัน ฯลฯ เนื่องจากแต่ละประเภทไม่ได้ดำเนินการในลักษณะเดียวกัน และไม่ได้คาดการณ์สิ่งที่จะเกิดขึ้นต่อไปในห้องนอนที่บ้าน ห้องนอนในโรงแรม หรือสถานรับเลี้ยงเด็กแบบเดียวกัน โดยรวมแล้ว Places มีภาพมากกว่า 10 ล้านภาพที่ประกอบด้วยหมวดหมู่ฉากที่ไม่ซ้ำกันกว่า 400 หมวด ชุดข้อมูลมีรูปภาพการฝึกอบรม 5,000 ถึง 30,000 ภาพต่อคลาส ซึ่งสอดคล้องกับความถี่ที่เกิดขึ้นจริง ชุดข้อมูล Places ช่วยให้เรียนรู้คุณสมบัติของฉากเชิงลึกสำหรับงานการจดจำฉากต่างๆ โดยใช้เครือข่ายประสาทเทียม (CNN) โดยมีเป้าหมายเพื่อสร้างการแสดงที่ล้ำสมัยบนเกณฑ์มาตรฐานที่เน้นฉากเป็นหลัก

ที่นี่เรามีฐานข้อมูล Places และ CNN ที่ผ่านการฝึกอบรมสำหรับการวิจัยเชิงวิชาการและการศึกษา

แยก ตัวอย่าง
'train' 10,653,087
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ชื่อไฟล์ ข้อความ สตริง
ภาพ ภาพ (256, 256, 3) uint8
ฉลาก ป้ายกำกับคลาส int64

การสร้างภาพ

  • การอ้างอิง :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}