การจัดหมวดหมู่แบบสอบถามตามผลลัพธ์ของภาพ
เผยแพร่แล้ว: 2022-04-27Google ได้รับสิทธิบัตรเมื่อเร็ว ๆ นี้ในการจัดหมวดหมู่คำค้นหาตามผลลัพธ์รูปภาพ
สิทธิบัตรบอกเราว่า: “โปรแกรมค้นหาทางอินเทอร์เน็ตให้ข้อมูลเกี่ยวกับทรัพยากรที่อินเทอร์เน็ตเข้าถึงได้ (เช่น หน้าเว็บ รูปภาพ เอกสารข้อความ เนื้อหามัลติมีเดีย) ที่ตอบสนองต่อคำค้นหาของผู้ใช้โดยการส่งคืน เมื่อค้นหารูปภาพ ชุดของผลการค้นหารูปภาพ ในการตอบข้อซักถาม”
ผลการค้นหารวมถึง ตัวอย่างเช่น Uniform Resource Locator (URL) ของรูปภาพหรือเอกสารที่มีรูปภาพและตัวอย่างข้อมูล
การจัดอันดับ SERP โดยใช้ฟังก์ชันการให้คะแนน
ผลการค้นหาสามารถจัดอันดับ (เช่น ตามลำดับ) ตามคะแนนที่กำหนดโดยฟังก์ชันการให้คะแนน
ฟังก์ชันการให้คะแนนจะจัดอันดับผลการค้นหาตามสัญญาณต่างๆ:
- ข้อความค้นหาปรากฏขึ้นที่ใด (และบ่อยเพียงใด) ในข้อความเอกสารรอบๆ รูปภาพ
- คำบรรยายภาพหรือข้อความแสดงแทนความคิด
- มาตรฐานของข้อความค้นหาในผลการค้นหาที่จัดทำดัชนีโดยเครื่องมือค้นหา
โดยทั่วไป หัวข้อที่อธิบายไว้ในสิทธิบัตรนี้อยู่ในวิธีการที่รวมถึง:
- การรับรูปภาพจากผลลัพธ์รูปภาพแรกสำหรับข้อความค้นหาแรก โดยที่รูปภาพที่ได้รับจำนวนหนึ่งซึ่งเกี่ยวข้องกับคะแนนและข้อมูลพฤติกรรมผู้ใช้ซึ่งระบุการโต้ตอบของผู้ใช้กับรูปภาพที่ได้รับเมื่อรูปภาพที่ได้รับนั้นเป็นผลการค้นหาสำหรับข้อความค้นหา
- การเลือกรูปภาพที่ได้มาจำนวนหนึ่งซึ่งมีข้อมูลพฤติกรรมที่เกี่ยวข้องซึ่งเป็นไปตามเกณฑ์
- เชื่อมโยงภาพแรกที่เลือกกับคำอธิบายประกอบหลายรายการตามการวิเคราะห์เนื้อหาของภาพที่เลือก
สิ่งเหล่านี้สามารถเลือกรวมคุณสมบัติต่อไปนี้ได้
แบบสอบถามแรกสามารถเชื่อมโยงกับหมวดหมู่ตามคำอธิบายประกอบ การจัดหมวดหมู่การค้นหาและการเชื่อมโยงคำอธิบายประกอบสามารถจัดเก็บไว้ใช้ในอนาคตได้ ผลลัพธ์รูปภาพที่สองตอบสนองต่อการสืบค้นที่สองที่เหมือนกันหรือเหมือนกับการสืบค้นแรกจะได้รับ
รูปภาพที่สองแต่ละรูปจะเชื่อมโยงกับคะแนน และรูปภาพที่สองสามารถแก้ไขได้ตามหมวดหมู่ที่เกี่ยวข้องกับคำค้นหาแรก
การจัดหมวดหมู่คิวรีประเภทหนึ่งสามารถระบุได้ว่าคิวรีแรกเป็นคิวรีแบบบุคคลคนเดียว และเพิ่มคะแนนของรูปภาพที่สอง ซึ่งคำอธิบายประกอบระบุว่าชุดของรูปภาพที่สองมีใบหน้าเดียว
การจัดหมวดหมู่ข้อความค้นหาหนึ่งรายการสามารถระบุได้ว่าข้อความค้นหาแรกมีความหลากหลาย และเพิ่มคะแนนของรูปภาพที่สอง ซึ่งคำอธิบายประกอบระบุว่าชุดของรูปภาพที่สองมีความหลากหลาย
หมวดหมู่หนึ่งสามารถระบุได้ว่าข้อความค้นหาแรกเป็นข้อความค้นหา และเพิ่มคะแนนของรูปภาพที่สอง ซึ่งคำอธิบายประกอบระบุว่าชุดของรูปภาพที่สองประกอบด้วยข้อความ
แบบสอบถามแรกจะได้รับให้กับตัวแยกประเภทที่ได้รับการฝึกอบรมเพื่อกำหนดการจัดประเภทแบบสอบถามในหมวดหมู่
การวิเคราะห์เนื้อหาของรูปภาพแรกที่เลือกสามารถรวมการจัดกลุ่มผลลัพธ์ของรูปภาพแรกเพื่อกำหนดคำอธิบายประกอบในคำอธิบายประกอบ ข้อมูลพฤติกรรมผู้ใช้อาจเป็นจำนวนครั้งที่ผู้ใช้เลือกรูปภาพในผลการค้นหาสำหรับข้อความค้นหาแรก
หัวข้อที่อธิบายไว้ในสิทธิบัตรนี้สามารถนำไปปฏิบัติได้ ดังนั้น จึงควรตระหนักถึงข้อดีดังต่อไปนี้:
ชุดผลลัพธ์รูปภาพจะได้รับการวิเคราะห์เพื่อหาคำอธิบายประกอบรูปภาพและการจัดหมวดหมู่ข้อความค้นหา และผู้ใช้โต้ตอบกับผลการค้นหารูปภาพสามารถใช้เพื่อสร้างประเภทสำหรับข้อความค้นหา
การจัดหมวดหมู่แบบสอบถาม
ในทางกลับกัน หมวดหมู่คำค้นหาสามารถปรับปรุงความเกี่ยวข้อง คุณภาพ และความหลากหลายของผลการค้นหารูปภาพได้
การจัดประเภทแบบสอบถามยังสามารถใช้เป็นส่วนหนึ่งของการประมวลผลแบบสอบถามหรือในกระบวนการออฟไลน์
หมวดหมู่แบบสอบถามสามารถใช้เพื่อให้คำแนะนำแบบสอบถามอัตโนมัติเช่น "แสดงเฉพาะภาพที่มีใบหน้า" หรือ "แสดงเฉพาะคลิปอาร์ต"
การจัดหมวดหมู่แบบสอบถามตามผลลัพธ์ของภาพ
นักประดิษฐ์: Anna Majkowska และ Cristian Tapus
ผู้รับมอบหมาย: GOOGLE LLC
สิทธิบัตรสหรัฐอเมริกา: 11,308,149
ได้รับ: 19 เมษายน 2022
ยื่น: 3 พฤศจิกายน 2017
เชิงนามธรรม
วิธีการ ระบบ และอุปกรณ์ รวมถึงโปรแกรมคอมพิวเตอร์ที่เข้ารหัสบนสื่อบันทึกข้อมูลคอมพิวเตอร์ สำหรับการจัดหมวดหมู่การสืบค้นตามผลลัพธ์ของรูปภาพ
ในด้านหนึ่ง วิธีการรวมถึงการรับรูปภาพจากผลลัพธ์รูปภาพที่ตอบสนองต่อการสืบค้น โดยรูปภาพแต่ละรูปจะเชื่อมโยงกับลำดับในผลลัพธ์รูปภาพและข้อมูลพฤติกรรมผู้ใช้ตามลำดับสำหรับรูปภาพเป็นผลการค้นหาสำหรับข้อความค้นหาแรกและการเชื่อมโยงของ รูปภาพแรกพร้อมคำอธิบายประกอบจำนวนมากโดยอิงจากการวิเคราะห์เนื้อหาของรูปภาพแรกที่เลือก
ระบบที่ใช้การจัดหมวดหมู่คิวรีเพื่อปรับปรุงชุดผลลัพธ์ที่ส่งคืนสำหรับการสืบค้น
ไคลเอนต์ เช่น เว็บเบราว์เซอร์หรือกระบวนการอื่นๆ ที่ดำเนินการบนอุปกรณ์คอมพิวเตอร์จะส่งการสืบค้นข้อมูลเข้าไปยังเครื่องมือค้นหา และเครื่องมือค้นหาจะส่งคืนผลการค้นหารูปภาพไปยังไคลเอ็นต์ ในการใช้งานบางอย่าง เคียวรีประกอบด้วยข้อความ เช่น อักขระในชุดอักขระ (เช่น “มะเขือเทศสีแดง”)
แบบสอบถามประกอบด้วยรูปภาพ เสียง วิดีโอ หรือการรวมกันของสิ่งเหล่านี้ แบบสอบถามประเภทอื่นๆ ได้ เสิร์ชเอ็นจิ้นจะค้นหาผลลัพธ์โดยอิงจากแบบสอบถามรุ่นอื่นที่เท่ากับ กว้างกว่า หรือเฉพาะเจาะจงกว่าแบบสอบถามอินพุต
ผลการค้นหารูปภาพเป็นรายการเอกสารหรือลิงก์ที่เรียงลำดับหรือจัดอันดับ ซึ่งถูกกำหนดให้ตอบสนองต่อข้อความค้นหาที่ป้อน โดยเอกสารที่พิจารณาว่ามีความเกี่ยวข้องมากที่สุดมีอันดับสูงสุด สำเนาคือหน้าเว็บ รูปภาพ หรือไฟล์อิเล็กทรอนิกส์อื่นๆ
ในกรณีของการค้นหารูปภาพ เครื่องมือค้นหาจะกำหนดความเกี่ยวข้องของรูปภาพตามอย่างน้อยก็บางส่วนดังต่อไปนี้:
- เนื้อหาของภาพ
- ข้อความรอบภาพ
- คำบรรยายภาพ
- ข้อความแสดงแทนของรูปภาพ
หมวดหมู่ที่เกี่ยวข้องกับคำถาม
ในการสร้างผลการค้นหารูปภาพ เครื่องมือค้นหาในการใช้งานบางอย่างจะส่งคำขอสำหรับหมวดหมู่ที่เกี่ยวข้องกับข้อความค้นหา เสิร์ชเอ็นจิ้นสามารถใช้หมวดหมู่ที่เกี่ยวข้องเพื่อจัดลำดับผลการค้นหารูปภาพใหม่โดยเพิ่มอันดับของผลลัพธ์รูปภาพที่ระบุว่าเป็นของหมวดหมู่ที่เกี่ยวข้อง
ในบางกรณี อาจลดผลลัพธ์ของภาพที่ไม่ได้อยู่ในหมวดหมู่ที่เกี่ยวข้องหรือทั้งสองอย่าง
เสิร์ชเอ็นจิ้นยังสามารถใช้หมวดหมู่ของผลลัพธ์เพื่อกำหนดว่าพวกเขาควรได้รับการจัดอันดับอย่างไรในชุดผลลัพธ์ที่สรุปแล้วร่วมกับหรือหมวดหมู่ของข้อความค้นหา
กลไกการจัดหมวดหมู่หรือกระบวนการอื่นใช้ผลลัพธ์รูปภาพที่ดึงมาสำหรับการสืบค้นและที่เก็บข้อมูลพฤติกรรมผู้ใช้เพื่อรับหมวดหมู่สำหรับแบบสอบถาม ที่เก็บมีข้อมูลพฤติกรรมผู้ใช้ ที่เก็บข้อมูลระบุจำนวนครั้งที่ประชากรของผู้ใช้เลือกผลลัพธ์รูปภาพสำหรับข้อความค้นหาที่กำหนด
การเลือกรูปภาพสามารถทำได้หลายวิธี เช่น การใช้แป้นพิมพ์ เมาส์คอมพิวเตอร์หรือการใช้นิ้ว คำสั่งเสียง หรือวิธีการอื่นๆ ข้อมูลพฤติกรรมผู้ใช้รวมถึง “ข้อมูลการคลิก”
คลิกข้อมูลระบุว่าผู้ใช้ดูหรือ "อาศัยอยู่" บนผลลัพธ์ภาพนานแค่ไหน
ข้อมูลการคลิกระบุระยะเวลาที่ผู้ใช้ดูหรือ "อาศัยอยู่" บนผลลัพธ์รูปภาพหลังจากเลือกในรายการผลลัพธ์สำหรับข้อความค้นหา ตัวอย่างเช่น การจ้องรูปภาพเป็นเวลานาน (เช่น นานกว่า 1 นาที) เรียกว่า "คลิกค้าง" สามารถระบุได้ว่าผู้ใช้พบรูปภาพที่เกี่ยวข้องกับข้อความค้นหาของผู้ใช้
ช่วงเวลาสั้นๆ ในการดูภาพ (เช่น น้อยกว่า 30 วินาที) ที่เรียกว่า "ช็อตคลิก" สามารถตีความได้ว่าไม่มีความเกี่ยวข้องของภาพ ข้อมูลพฤติกรรมผู้ใช้ประเภทอื่นๆ เป็นไปได้
ตามภาพประกอบ ข้อมูลพฤติกรรมของผู้ใช้สามารถสร้างขึ้นโดยกระบวนการที่สร้างเรกคอร์ดสำหรับเอกสารผลลัพธ์ที่ผู้ใช้เลือกเพื่อตอบสนองต่อแบบสอบถามเฉพาะ แต่ละแบบฟอร์มสามารถแสดงเป็น tuple: <document, query, data>) ซึ่งรวมถึง:
- คำถามที่ส่งโดยผู้ใช้
- การอ้างอิงแบบสอบถามระบุแบบสอบถาม
- เอกสารอ้างอิงกระดาษที่ผู้ใช้เลือกเพื่อตอบแบบสอบถาม
- การรวมข้อมูลการคลิก (เช่น จำนวนการคลิกแต่ละประเภท) สำหรับผู้ใช้ทั้งหมดหรือกลุ่มย่อยของผู้ใช้ทั้งหมดที่เลือกการอ้างอิงเอกสารเพื่อตอบสนองต่อแบบสอบถาม
ส่วนขยายของวิธีการที่อิงทูเพิลนี้ใช้กับข้อมูลพฤติกรรมผู้ใช้ได้ ตัวอย่างเช่น ข้อมูลพฤติกรรมของผู้ใช้สามารถขยายเพื่อรวมเฉพาะสถานที่ (เช่น ประเทศหรือรัฐ) หรือตัวระบุเฉพาะภาษา
เมื่อรวมตัวระบุดังกล่าว tuple เฉพาะประเทศจะประกอบด้วยประเทศที่ข้อความค้นหาของผู้ใช้เริ่มต้น และ tuple เฉพาะภาษาจะประกอบด้วยภาษาของข้อความค้นหาของผู้ใช้
เพื่อความง่ายในการนำเสนอ ข้อมูลพฤติกรรมผู้ใช้ที่เกี่ยวข้องกับเอกสาร A-CCC สำหรับแบบสอบถามจะแสดงในตารางว่าเป็นข้อมูลพฤติกรรมผู้ใช้ที่น่าพอใจ "สูง" "ปานกลาง" หรือ "ต่ำ" (เช่น พฤติกรรมของผู้ใช้ ข้อมูลที่บ่งชี้ความเกี่ยวข้องระหว่างเอกสารกับแบบสอบถาม)
ข้อมูลพฤติกรรมผู้ใช้สำหรับเอกสาร
ข้อมูลพฤติกรรมผู้ใช้ที่ดีสำหรับเอกสารสามารถระบุได้ว่ากระดาษถูกเลือกโดยผู้ใช้เมื่อมีการดูในผลลัพธ์ของแบบสอบถาม หรือเมื่อผู้ใช้ดูเอกสารหลังจากเลือกจากผลลัพธ์สำหรับแบบสอบถาม ผู้ใช้ดูเอกสารสำหรับ ระยะเวลาที่ขยายออกไป (เช่น ผู้ใช้พบว่าเอกสารมีความเกี่ยวข้องกับคำถาม)
เครื่องมือจัดหมวดหมู่ทำงานร่วมกับเครื่องมือค้นหาโดยใช้ผลลัพธ์ที่ส่งคืนและข้อมูลพฤติกรรมผู้ใช้เพื่อกำหนดหมวดหมู่ของข้อความค้นหา จากนั้นจัดลำดับผลลัพธ์ใหม่ก่อนที่จะส่งคืนให้กับผู้ใช้
โดยทั่วไป สำหรับแบบสอบถาม (เช่น แบบสอบถามหรือรูปแบบอื่นของแบบสอบถาม) ที่ระบุในคำขอประเภทแบบสอบถาม กลไกการจัดหมวดหมู่จะวิเคราะห์ผลลัพธ์รูปภาพสำหรับแบบสอบถามเพื่อตรวจสอบว่าแบบสอบถามเป็นของประเภทหรือไม่ ผู้ใช้เลือกผลการค้นหาภาพที่วิเคราะห์ในการใช้งานบางอย่างเป็นผลการค้นหาสำหรับข้อความค้นหาจำนวนครั้งที่สูงกว่าเกณฑ์ทั้งหมด (เช่น ตั้งไว้อย่างน้อยสิบครั้ง)
เครื่องมือจัดหมวดหมู่จะวิเคราะห์ผลลัพธ์รูปภาพทั้งหมดที่เครื่องมือค้นหาดึงมาสำหรับข้อความค้นหาที่กำหนด ในการใช้งานอื่น ๆ
กลไกจัดหมวดหมู่จะวิเคราะห์ผลลัพธ์รูปภาพสำหรับข้อความค้นหาที่เมตริก (เช่น จำนวนการเลือกทั้งหมดหรือการวัดอื่น) สำหรับข้อมูลการคลิกอยู่เหนือเกณฑ์
ผลลัพธ์ของภาพสามารถวิเคราะห์ได้ทางออนไลน์โดยใช้เทคนิคการมองเห็นด้วยคอมพิวเตอร์ในรูปแบบต่างๆ ทั้งแบบออฟไลน์หรือออนไลน์ ในระหว่างกระบวนการให้คะแนน รูปภาพจะได้รับคำอธิบายประกอบด้วยข้อมูลที่ดึงมาจากเนื้อหาที่เป็นภาพ
คำอธิบายประกอบภาพ
ตัวอย่างเช่น สามารถเก็บคำอธิบายประกอบรูปภาพไว้ในที่เก็บคำอธิบายประกอบ รูปภาพที่วิเคราะห์แต่ละภาพ (เช่น ภาพที่ 1 ภาพที่ 2 เป็นต้น) จะเชื่อมโยงกับคำอธิบายประกอบ (เช่น A1, A2 เป็นต้น) ในภาพถ่ายกับการเชื่อมโยงคำอธิบายประกอบ
คำอธิบายประกอบอาจรวมถึง:
- จำนวนใบหน้าในภาพ
- ขนาดของแต่ละใบหน้า
- สีที่โดดเด่นของภาพ
- รูปภาพมีข้อความหรือกราฟหรือไม่
- รูปภาพเป็นภาพหน้าจอหรือไม่
นอกจากนี้ แต่ละภาพสามารถใส่คำอธิบายประกอบด้วยลายนิ้วมือ ซึ่งสามารถระบุได้ว่าภาพสองภาพเหมือนกันหรือเหมือนกัน
ถัดไป เครื่องมือจัดหมวดหมู่จะวิเคราะห์ผลลัพธ์รูปภาพสำหรับข้อความค้นหาที่ระบุและคำอธิบายประกอบเพื่อกำหนดประเภทการสืบค้น การเชื่อมโยงของหมวดหมู่เคียวรี (เช่น C1, C2 และอื่นๆ) สำหรับเคียวรีที่ระบุ (เช่น เคียวรี 1, เคียวรี 2 เป็นต้น) สามารถกำหนดได้หลายวิธี เช่น การใช้ฮิวริสติกอย่างง่ายหรือการใช้ตัวแยกประเภทอัตโนมัติ
ตัวจัดหมวดหมู่แบบสอบถามอย่างง่ายโดยอิงจากการวิเคราะห์พฤติกรรม
ตัวอย่างเช่น ตัวจัดหมวดหมู่เคียวรีอย่างง่ายที่ยึดตามฮิวริสติกสามารถใช้เพื่อกำหนดสีที่โดดเด่นที่ต้องการสำหรับเคียวรี (และว่ามีหนึ่งสีหรือไม่)
ตัวอย่างเช่น ฮิวริสติกอาจกล่าวได้ว่า หากรูปภาพที่คลิกบ่อยที่สุดจาก 20 อันดับแรกสำหรับข้อความค้นหา อย่างน้อย 70% มีสีแดงที่โดดเด่น การสืบค้นนั้นจะถูกจัดประเภทเป็น "ข้อความค้นหาสีแดง" สำหรับข้อความค้นหาดังกล่าว เสิร์ชเอ็นจิ้นสามารถจัดลำดับผลลัพธ์ที่ดึงมาใหม่เพื่อเพิ่มอันดับของรูปภาพทั้งหมดที่มีสีแดงเป็นสีหลัก
การจัดหมวดหมู่เดียวกันนี้สามารถใช้ได้กับสีมาตรฐานอื่นๆ ทั้งหมด ข้อได้เปรียบของแนวทางนี้ในการวิเคราะห์ข้อความค้นหามากเกินไปคือใช้งานได้กับทุกภาษาโดยไม่ต้องแปล (เช่น จะส่งเสริมรูปภาพที่มีสีแดงโดดเด่นสำหรับคำถาม "แอปเปิ้ลแดง" ในภาษาใดก็ได้) มีประสิทธิภาพมากขึ้น (เช่น จะไม่เพิ่มอันดับของภาพสีแดงสำหรับข้อความค้นหา "ทะเลแดง")
เครื่องมือจัดหมวดหมู่ตัวอย่าง
กลไกการจัดหมวดหมู่สามารถทำงานในโหมดออนไลน์หรือโหมดออฟไลน์ ซึ่งการเชื่อมโยงหมวดหมู่การสืบค้นจะถูกจัดเก็บไว้ล่วงหน้า (เช่น ในตาราง) เพื่อใช้โดยเครื่องมือค้นหาระหว่างการประมวลผลข้อความค้นหา
เอ็นจิ้นได้รับผลการค้นหารูปภาพสำหรับข้อความค้นหาที่กำหนดและให้ผลลัพธ์รูปภาพแก่ผู้ใส่คำอธิบายประกอบรูปภาพ คำอธิบายประกอบรูปภาพแต่ละตัวจะวิเคราะห์ผลลัพธ์ของรูปภาพและดึงข้อมูลเกี่ยวกับเนื้อหาที่มองเห็นได้ของรูปภาพ ซึ่งจะถูกจัดเก็บเป็นคำอธิบายประกอบรูปภาพ (เช่น คำอธิบายประกอบรูปภาพ) สำหรับแนวคิด
คำอธิบายประกอบภาพใบหน้า
ตามภาพประกอบ คำอธิบายประกอบภาพใบหน้า:
- กำหนดจำนวนใบหน้าในภาพและขนาดของแต่ละใบหน้า
- เครื่องบันทึกภาพลายนิ้วมือจะดึงคุณลักษณะของภาพที่มองเห็นในรูปแบบย่อ (ลายนิ้วมือ) ซึ่งสามารถนำมาเปรียบเทียบกับลายนิ้วมือของภาพอื่นเพื่อตรวจสอบว่าภาพทั้งสองมีความคล้ายคลึงกันหรือไม่
- เครื่องบันทึกภาพหน้าจอเป็นตัวกำหนดว่าภาพนั้นเป็นภาพหน้าจอหรือไม่
- คำอธิบายประกอบรูปภาพแบบข้อความจะกำหนดว่ารูปภาพมีข้อความหรือไม่
- แบบสอบถามรูปภาพกราฟ/แผนภูมิกำหนดว่ารูปภาพมีกราฟหรือแผนภูมิ (เช่น กราฟแท่ง)
- คำอธิบายประกอบสีที่โดดเด่นจะกำหนดว่ารูปภาพมีสีที่โดดเด่นหรือไม่
สามารถใช้คำอธิบายประกอบรูปภาพอื่น ๆ ได้เช่นกัน ตัวอย่างเช่น คำอธิบายประกอบรูปภาพหลายตัวได้รับการอธิบายไว้ในบทความเรื่อง “Rapid Object Detection using a Boosted Cascade of Simple Features” โดย Viola, P.; Jones, M. , Mitsubishi Electric Research Laboratories, TR2004-043 (พฤษภาคม 2547)
ถัดไป เครื่องมือจัดหมวดหมู่จะวิเคราะห์ผลลัพธ์ของรูปภาพสำหรับข้อความค้นหาที่ระบุและคำอธิบายประกอบเพื่อกำหนดหมวดหมู่ของข้อความค้นหา (เช่น หมวดหมู่ของข้อความค้นหา) หมวดหมู่แบบสอบถามถูกกำหนดโดยใช้ตัวแยกประเภท และตัวแยกประเภทแบบสอบถามสามารถรับรู้ได้โดยใช้ระบบการเรียนรู้ของเครื่อง
การใช้ Adaptive Boosting
ตามภาพประกอบ AdaBoost ย่อมาจาก Adaptive Boosting เป็นระบบการเรียนรู้ของเครื่องที่สามารถใช้กับอัลกอริธึมการเรียนรู้อื่น ๆ เพื่อปรับปรุงประสิทธิภาพ AdaBoost ถูกใช้เพื่อสร้างการจัดหมวดหมู่แบบสอบถาม (อัลกอริธึมการเรียนรู้เพิ่มเติมเป็นไปได้)
AdaBoost เรียกใช้คำอธิบายประกอบรูปภาพที่ "อ่อนแอ" ในชุดของรอบ ตามภาพประกอบ ตัวแยกประเภทการสืบค้นแบบคนเดียวสามารถรับได้โดยใช้อัลกอริธึมของการเรียนรู้ที่ได้รับการฝึกฝนเพื่อกำหนดว่าการสืบค้นเรียกใช้รูปภาพของบุคคลเพียงคนเดียวหรือไม่
ตามภาพประกอบ ตัวแยกประเภทการสืบค้นสามารถได้รับการฝึกอบรมด้วยชุดข้อมูลที่ประกอบด้วยการสืบค้น ชุดของเวกเตอร์คุณลักษณะที่แสดงภาพผลลัพธ์สำหรับคำถามที่มีใบหน้าเป็นศูนย์หรือมากกว่า และการจัดหมวดหมู่ที่ถูกต้องสำหรับข้อความค้นหา (เช่น ใบหน้าหรือไม่ก็ตาม) . สำหรับการเรียกแต่ละครั้ง ตัวแยกประเภทแบบสอบถามจะอัพเดตการกระจายน้ำหนักที่ระบุถึงความสำคัญของตัวอย่างในชุดข้อมูลการฝึกสำหรับการจัดประเภท
ในแต่ละรอบ น้ำหนักของตัวอย่างการฝึกอบรมที่เป็นความลับแต่ละรายการจะเพิ่มขึ้น (หรือผลที่ตามมาของตัวอย่างการฝึกอบรมที่เป็นความลับแต่ละรายการลดลง) ดังนั้นการจัดหมวดหมู่การค้นหาใหม่จะเน้นที่ตัวอย่างเหล่านั้นมากขึ้น การจัดหมวดหมู่คิวรีที่ได้รับการฝึกอบรมที่ได้ผลลัพธ์สามารถนำไปใช้เป็นอินพุตคิวรีและแสดงความน่าจะเป็นที่คิวรีต้องการสำหรับรูปภาพที่มีบุคคลเพียงคนเดียว
ตัวแยกประเภทคิวรีที่หลากหลาย/เป็นเนื้อเดียวกันจะทำหน้าที่เป็นอินพุตของคิวรีและให้ผลลัพธ์ความน่าจะเป็นที่คิวรีนั้นใช้สำหรับรูปภาพต่างๆ ลักษณนามใช้อัลกอริธึมการจัดกลุ่มเพื่อจัดกลุ่มผลลัพธ์ของภาพตามลายนิ้วมือตามการวัดระยะห่างจากกัน แต่ละรูปภาพเชื่อมโยงกับตัวระบุคลัสเตอร์
ตัวระบุคลัสเตอร์อิมเมจใช้เพื่อกำหนดจำนวนคลัสเตอร์ ขนาดของกลุ่ม และความคล้ายคลึงกันระหว่างคลัสเตอร์ที่เกิดจากอิมเมจในชุดผลลัพธ์ ตัวอย่างเช่น ข้อมูลนี้ใช้เพื่อเชื่อมโยงความน่าจะเป็นที่ข้อความค้นหานั้นเจาะจง (หรือเชิญซ้ำ) หรือไม่
การเชื่อมโยงแบบสอบถามกับความหมายที่เป็นที่ยอมรับและการเป็นตัวแทน
การจัดหมวดหมู่แบบสอบถามยังสามารถใช้เพื่อเชื่อมโยงการสืบค้นกับความหมายและการแสดงตามบัญญัติ ตัวอย่างเช่น หากมีคลัสเตอร์ขนาดใหญ่เพียงคลัสเตอร์เดียวหรือหลายคลัสเตอร์ ความน่าจะเป็นที่คำถามจะเกี่ยวข้องกับผลลัพธ์รูปภาพที่ซ้ำกันจะสูง หากมีคลัสเตอร์ที่เล็กกว่าจำนวนมาก โอกาสที่การสืบค้นข้อมูลจะเชื่อมโยงกับผลลัพธ์รูปภาพเดียวกันนั้นต่ำ

รูปภาพที่ซ้ำกันมักจะไม่ค่อยมีประโยชน์ เนื่องจากไม่มีข้อมูลเพิ่มเติม ดังนั้นควรถูกลดระดับเป็นผลลัพธ์ของการค้นหา แต่มีข้อยกเว้น ตัวอย่างเช่น หากผลลัพธ์เริ่มต้นมีรายการที่ซ้ำกันจำนวนมาก (คลัสเตอร์ขนาดใหญ่สองสามรายการ) ข้อความค้นหานั้นเฉพาะเจาะจง และรายการซ้ำไม่ควรถูกลดระดับ
การจัดหมวดหมู่แบบสอบถามภาพหน้าจอ/ไม่ใช่ภาพหน้าจอจะใช้เป็นการป้อนข้อมูลแบบสอบถามและแสดงผลความน่าจะเป็นที่แบบสอบถามจะเรียกใช้รูปภาพที่เป็นภาพหน้าจอ ตัวแยกประเภทแบบสอบถามข้อความ/ไม่ใช่ข้อความยอมรับเป็นการป้อนแบบสอบถามและแสดงโอกาสที่แบบสอบถามจะเรียกรูปภาพที่มีข้อความ
การจัดหมวดหมู่คิวรีแบบกราฟ/ไม่ใช่กราฟจะใช้อินพุตของคิวรีและแสดงผลความน่าจะเป็นที่คิวรีเรียกใช้รูปภาพที่มีกราฟหรือแผนภูมิ ตัวแยกประเภทการสืบค้นด้วยสี 133f ใช้การสืบค้นข้อมูลและแสดงโอกาสที่การสืบค้นจะเรียกใช้ภาพที่มีสีเดียว ตัวแยกประเภทแบบสอบถามอื่น ๆ ได้
การปรับปรุงความเกี่ยวข้องของผลลัพธ์รูปภาพตามการจัดหมวดหมู่การค้นหา
ผู้ค้นหาสามารถโต้ตอบกับระบบผ่านไคลเอนต์หรืออุปกรณ์อื่นๆ ตัวอย่างเช่น อุปกรณ์ไคลเอนต์อาจเป็นเทอร์มินัลคอมพิวเตอร์ภายในเครือข่ายท้องถิ่น (LAN) หรือเครือข่ายบริเวณกว้าง (WAN) อุปกรณ์ไคลเอนต์อาจเป็นอุปกรณ์พกพา (เช่น โทรศัพท์มือถือ คอมพิวเตอร์พกพา ผู้ช่วยเดสก์ท็อปส่วนบุคคล ฯลฯ) ที่สามารถสื่อสารผ่าน LAN, WAN หรือเครือข่ายอื่นๆ (เช่น เครือข่ายโทรศัพท์มือถือ)
อุปกรณ์ไคลเอนต์สามารถรวมหน่วยความจำเข้าถึงโดยสุ่ม (RAM) (หรือหน่วยความจำอื่นและอุปกรณ์เก็บข้อมูล) และโปรเซสเซอร์
โปรเซสเซอร์ได้รับการจัดโครงสร้างเพื่อประมวลผลคำสั่งและข้อมูลภายในระบบ โปรเซสเซอร์เป็นไมโครโปรเซสเซอร์แบบเธรดเดียวหรือแบบมัลติเธรดที่มีแกนประมวลผล โปรเซสเซอร์ได้รับโครงสร้างเพื่อดำเนินการคำสั่งที่เก็บไว้ใน RAM (หรือหน่วยความจำอื่นและอุปกรณ์เก็บข้อมูลที่มาพร้อมกับอุปกรณ์ไคลเอนต์) เพื่อแสดงข้อมูลกราฟิกสำหรับส่วนต่อประสานผู้ใช้
ผู้ค้นหาสามารถเชื่อมต่อกับเครื่องมือค้นหาภายในระบบเซิร์ฟเวอร์เพื่อส่งคำค้นหาอินพุต เสิร์ชเอ็นจิ้นคือเครื่องมือค้นหารูปภาพหรือเครื่องมือค้นหาทั่วไปที่สามารถดึงรูปภาพและเนื้อหาประเภทอื่นๆ เช่น เอกสาร (เช่น หน้า HTML)
เมื่อผู้ใช้ส่งคำถามเกี่ยวกับการป้อนข้อมูลผ่านอุปกรณ์ป้อนข้อมูลที่เชื่อมต่อกับอุปกรณ์ไคลเอ็นต์ คำถามฝั่งไคลเอ็นต์จะถูกส่งไปยังเครือข่ายและส่งต่อไปยังระบบเซิร์ฟเวอร์เป็นแบบสอบถามฝั่งเซิร์ฟเวอร์ ระบบเซิร์ฟเวอร์สามารถเป็นอุปกรณ์เซิร์ฟเวอร์ในสถานที่ อุปกรณ์เซิร์ฟเวอร์รวมถึงอุปกรณ์หน่วยความจำที่ประกอบด้วยเครื่องมือค้นหาที่โหลดอยู่ในนั้น
โปรเซสเซอร์ได้รับการจัดโครงสร้างเพื่อประมวลผลคำสั่งภายในอุปกรณ์ คำแนะนำเหล่านี้สามารถติดตั้งส่วนประกอบของเครื่องมือค้นหาได้ โปรเซสเซอร์สามารถเป็นแบบเธรดเดียวหรือแบบมัลติเธรด และมีแกนประมวลผลจำนวนมาก โปรเซสเซอร์สามารถประมวลผลคำสั่งที่เก็บไว้ในหน่วยความจำที่เกี่ยวข้องกับเสิร์ชเอ็นจิ้นและส่งข้อมูลไปยังอุปกรณ์ไคลเอนต์ผ่านเครือข่ายเพื่อสร้างการนำเสนอแบบกราฟิกในส่วนต่อประสานผู้ใช้ของอุปกรณ์ไคลเอนต์ (เช่น ผลการค้นหาบนหน้าเว็บที่แสดงในเว็บ เบราว์เซอร์)
เครื่องมือค้นหาได้รับข้อความค้นหาฝั่งเซิร์ฟเวอร์ เสิร์ชเอ็นจิ้นใช้ข้อมูลภายในคำค้นหาที่ป้อน (เช่น คำที่ใช้ค้นหา) เพื่อค้นหาเอกสารที่เกี่ยวข้อง เสิร์ชเอ็นจิ้นสามารถรวมเอ็นจิ้นการจัดทำดัชนีที่ค้นหาคลังข้อมูล (เช่น หน้าเว็บบนอินเทอร์เน็ต) เพื่อสร้างดัชนีเอกสารที่พบในคลังข้อมูลนั้น ข้อมูลดัชนีสำหรับเอกสารคลังข้อมูลสามารถเก็บไว้ในฐานข้อมูลดัชนี
ฐานข้อมูลดัชนีนี้สามารถเข้าถึงได้เพื่อระบุเอกสารที่เกี่ยวข้องกับผู้ใช้ โปรดทราบว่าสำเนาอิเล็กทรอนิกส์ (ซึ่งจะเรียกว่าเอกสาร) ไม่สอดคล้องกับไฟล์ บันทึกสามารถเก็บไว้ในส่วนหนึ่งของไฟล์ที่มีเอกสารอื่น ๆ ในไฟล์เดียวสำหรับเอกสารที่เป็นปัญหาหรือในไฟล์ที่ประสานกันจำนวนมาก นอกจากนี้ สำเนาสามารถเก็บไว้ในหน่วยความจำโดยไม่ต้องเก็บไว้ในไฟล์
เสิร์ชเอ็นจิ้นสามารถรวมเอ็นจิ้นการจัดอันดับเพื่อจัดอันดับเอกสารที่เกี่ยวข้องกับข้อความค้นหาอินพุต การจัดอันดับของเอกสารสามารถทำได้โดยใช้เทคนิคดั้งเดิมเพื่อกำหนดคะแนนการดึงข้อมูล (IR) สำหรับระเบียนที่จัดทำดัชนีตามคำค้นหาที่กำหนด
วิธีการที่เหมาะสมใดๆ อาจกำหนดความเกี่ยวข้องของเอกสารเฉพาะในคำค้นหาเฉพาะหรือข้อมูลอื่นๆ ที่ให้มา ตัวอย่างเช่น ระดับทั่วไปของลิงก์ย้อนกลับไปยังเอกสารที่มีคำค้นหาที่ตรงกัน อาจถูกใช้เพื่ออนุมานความเกี่ยวข้องของเอกสาร
โดยเฉพาะอย่างยิ่ง ถ้าเอกสารได้รับการเชื่อมโยงกับ (เช่น เป็นเป้าหมายของไฮเปอร์ลิงก์) โดยเอกสารที่เกี่ยวข้องอื่น ๆ อีกมากมาย (เช่น เอกสารที่มีรายการที่ตรงกันสำหรับคำค้นหา) ก็สามารถอนุมานได้ว่าเอกสารเป้าหมายมีความเกี่ยวข้องเป็นพิเศษ การอนุมานนี้สามารถเกิดขึ้นได้เนื่องจากผู้เขียนเอกสารชี้แนะน่าจะชี้ไปที่เอกสารอื่น ๆ ที่เกี่ยวข้องกับผู้ฟังเป็นส่วนใหญ่
เอกสารชี้เป้าลิงก์จากเอกสารที่เกี่ยวข้องอื่นๆ ซึ่งถือว่ามีความเกี่ยวข้องมากกว่า เอกสารฉบับแรกมีความเหมาะสมเป็นพิเศษเนื่องจากกำหนดเป้าหมายเอกสารที่เกี่ยวข้อง (หรือมีความเกี่ยวข้องสูง)
เทคนิคดังกล่าวอาจกำหนดความเกี่ยวข้องของเอกสารหรือปัจจัยกำหนดอย่างใดอย่างหนึ่ง นอกจากนี้ยังสามารถใช้วิธีการที่เหมาะสมเพื่อระบุและตัดความพยายามในการลงคะแนนที่เป็นการฉ้อโกงเพื่อเพิ่มความเกี่ยวข้องของหน้า
เพื่อปรับปรุงเทคนิคการจัดลำดับเอกสารแบบดั้งเดิมให้ดียิ่งขึ้น เอ็นจิ้นการจัดอันดับสามารถรับสัญญาณเพิ่มเติมจากเอ็นจิ้นการปรับอันดับเพื่อช่วยในการกำหนดอันดับที่เหมาะสมสำหรับเอกสาร
เมื่อใช้ร่วมกับคำอธิบายประกอบรูปภาพและการจัดหมวดหมู่ข้อความค้นหาที่อธิบายข้างต้น เครื่องมือแก้ไขอันดับจะมีการวัดความเกี่ยวข้องสำหรับเอกสาร เอ็นจิ้นการจัดอันดับสามารถใช้เพื่อปรับปรุงอันดับของผลการค้นหาที่มอบให้กับผู้ใช้
เอ็นจิ้นการปรับอันดับสามารถดำเนินการเพื่อสร้างการวัดความเกี่ยวข้อง
คะแนนของผลลัพธ์รูปภาพจะเพิ่มขึ้นหรือลดลงนั้นขึ้นอยู่กับว่าเนื้อหาภาพของรูปภาพ (ตามที่แสดงในคำอธิบายประกอบรูปภาพ) ตรงกับการจัดหมวดหมู่ของคิวรีหรือไม่ แต่ละหมวดหมู่ของรูปภาพจะได้รับการพิจารณา
ตัวอย่างเช่น หากการจัดหมวดหมู่ของข้อความค้นหาคือ "คนเดียว" ผลลัพธ์รูปภาพที่จัดอยู่ในประเภท "ภาพหน้าจอ" และ "หน้าเดียว" อันดับแรกจะมีคะแนนลดลงเนื่องจากหมวดหมู่ "ภาพหน้าจอ" สามารถเพิ่มคะแนนได้เนื่องจากประเภท "หน้าเดียว"
เสิร์ชเอ็นจิ้นสามารถส่งต่อรายการผลลัพธ์สุดท้ายที่จัดอันดับภายในผลการค้นหาฝั่งเซิร์ฟเวอร์ผ่านเครือข่าย ออกจากเครือข่าย ผลการค้นหาฝั่งไคลเอ็นต์สามารถรับได้โดยอุปกรณ์ไคลเอ็นต์ ซึ่งผลลัพธ์สามารถจัดเก็บไว้ภายใน RAM และโปรเซสเซอร์ใช้เพื่อแสดงผลลัพธ์บนอุปกรณ์เอาต์พุตสำหรับผู้ใช้
ระบบดึงข้อมูล
ส่วนประกอบเหล่านี้รวมถึง:
- เครื่องมือสร้างดัชนี
- เครื่องให้คะแนน
- เครื่องยนต์จัดอันดับ
- เอ็นจิ้นตัวปรับแต่งอันดับ
เอ็นจิ้นการทำดัชนีทำงานตามที่อธิบายไว้ข้างต้นสำหรับเอ็นจิ้นการทำดัชนี เอ็นจิ้นการให้คะแนนจะสร้างคะแนนสำหรับผลลัพธ์ของเอกสารโดยยึดตามฟีเจอร์มากมาย รวมถึงฟีเจอร์ตามเนื้อหาที่เชื่อมโยงคิวรีกับผลลัพธ์ของเอกสารและส่วนที่ไม่ขึ้นกับคิวรีซึ่งโดยทั่วไปจะระบุคุณภาพของผลลัพธ์ของเอกสาร
ฟีเจอร์ตามเนื้อหาสำหรับรูปภาพรวมถึงลักษณะของเอกสารที่มีรูปภาพ เช่น คิวรีที่ตรงกับชื่อเรื่องของเอกสารหรือคำอธิบายของรูปภาพ
คุณลักษณะที่ไม่ขึ้นกับคิวรี ได้แก่ แง่มุมต่างๆ ของการอ้างอิงโยงเอกสารของกระดาษหรือโดเมนหรือขนาดรูปภาพ
นอกจากนี้ ฟังก์ชันเฉพาะที่ใช้โดยเอ็นจิ้นการให้คะแนนสามารถถูกปรับแต่งเพื่อปรับการสนับสนุนคุณสมบัติต่างๆ ให้กับคะแนน IR สุดท้าย โดยใช้กระบวนการอัตโนมัติหรือกึ่งอัตโนมัติ
เอ็นจิ้นการจัดอันดับจะจัดอันดับผลลัพธ์ของเอกสารสำหรับแสดงต่อผู้ใช้ตามคะแนน IR ที่ได้รับจากเครื่องให้คะแนนและสัญญาณจากเอ็นจิ้นการปรับอันดับ
เอ็นจิ้นการปรับอันดับมีการวัดความเกี่ยวข้องสำหรับเอกสาร ซึ่งเอ็นจิ้นการจัดอันดับสามารถใช้เพื่อปรับปรุงอันดับของผลการค้นหาที่มอบให้กับผู้ใช้ องค์ประกอบการติดตามจะบันทึกข้อมูลพฤติกรรมของผู้ใช้ เช่น การเลือกผลลัพธ์ที่แสดงในลำดับของผู้ใช้แต่ละราย
องค์ประกอบการติดตามได้รับโค้ด JavaScript ที่ฝังอยู่ในการจัดอันดับหน้าเว็บที่ระบุการเลือกผู้ใช้ของผลลัพธ์เอกสารแต่ละรายการ และระบุเมื่อผู้ใช้กลับมาที่หน้าผลลัพธ์ ซึ่งระบุระยะเวลาที่ผู้ใช้ใช้ในการดูผลลัพธ์ของเอกสารที่เลือก
องค์ประกอบการติดตามคือระบบพร็อกซี่ซึ่งผู้ใช้เลือกผลลัพธ์ของเอกสาร คอมโพเนนต์การติดตามยังสามารถรวมซอฟต์แวร์ที่ติดตั้งไว้ล่วงหน้าสำหรับไคลเอ็นต์ (เช่น ปลั๊กอินของแถบเครื่องมือในระบบปฏิบัติการของไคลเอ็นต์)
การใช้งานอื่นๆ ก็เป็นไปได้เช่นกัน ตัวอย่างเช่น การใช้งานคุณลักษณะของเว็บเบราว์เซอร์ที่อนุญาตให้รวมแท็ก/คำสั่งในหน้า ซึ่งขอให้เบราว์เซอร์เชื่อมต่อกลับไปยังเซิร์ฟเวอร์ด้วยข้อความเกี่ยวกับลิงก์ที่ผู้ใช้คลิก
ข้อมูลที่บันทึกไว้จะถูกเก็บไว้ในบันทึกการเลือกผลลัพธ์ ข้อมูลที่บันทึกไว้ประกอบด้วยรายการบันทึกที่ระบุการโต้ตอบของผู้ใช้กับเอกสารผลลัพธ์แต่ละรายการที่แสดงสำหรับคำถามแต่ละข้อที่ส่งมา
สำหรับการเลือกผู้ใช้แต่ละรายของเอกสารผลลัพธ์ที่แสดงสำหรับการสืบค้น รายการบันทึกจะระบุข้อความค้นหา (Q) กระดาษ (D) เวลาพักของผู้ใช้ (T) ในเอกสาร ภาษา (L) ที่ผู้ใช้ใช้ และประเทศ (C) ที่ผู้ใช้น่าจะอยู่ (เช่น ตามเซิร์ฟเวอร์ที่ใช้ในการเข้าถึงระบบ IR) และรหัสภูมิภาค (R) ที่ระบุเขตเมืองใหญ่ของผู้ใช้
รายการบันทึกยังบันทึกข้อมูลเชิงลบ เช่น ผลลัพธ์ของเอกสารแสดงต่อผู้ใช้แต่ไม่ได้เลือก
ข้อมูลอื่นๆ เช่น:
- ตำแหน่งของการคลิก (เช่น การเลือกผู้ใช้ในส่วนต่อประสานผู้ใช้
- ข้อมูลเกี่ยวกับเซสชัน (เช่น การมีอยู่และประเภทของการคลิกก่อนหน้า (กิจกรรมเซสชันหลังการคลิก))
- R คะแนนของผลลัพธ์การคลิก
- คะแนน IR ของผลลัพธ์ทั้งหมดที่แสดงก่อนคลิก
- ชื่อเรื่องและตัวอย่างจะแสดงให้ผู้ใช้เห็นก่อนการคลิก
- คุกกี้ของผู้ใช้
- อายุคุกกี้
- ที่อยู่ IP (Internet Protocol)
- ตัวแทนผู้ใช้ของเบราว์เซอร์
- เร็วๆ นี้
เวลา (T) ระหว่างการคลิกผ่านครั้งแรกไปยังผลลัพธ์ของเอกสารกับผู้ใช้ที่กลับมาที่หน้าหลักและคลิกบนผลลัพธ์ของเอกสารอื่น (หรือส่งคำค้นหาใหม่) จะถูกบันทึกไว้ด้วย
การประเมินจะทำเกี่ยวกับเวลา (T) ว่าเวลานี้บ่งชี้ว่าเอกสารมีมุมมองที่ยาวขึ้นหรือสั้นกว่านั้นหรือไม่ เนื่องจากข้อโต้แย้งที่ขยายออกไปมักจะแสดงคุณภาพหรือความเกี่ยวข้องสำหรับผลลัพธ์การคลิกผ่าน การประเมินเวลา (T) นี้สามารถทำได้ร่วมกับเทคนิคการชั่งน้ำหนักต่างๆ
ส่วนประกอบที่แสดงสามารถนำมารวมกันในลักษณะต่างๆ และการกำหนดค่าระบบได้หลายแบบ เอ็นจิ้นการสิ้นสุดการให้คะแนนรวมเป็นเอ็นจิ้นอันดับเดียว เช่น เครื่องยนต์จัดอันดับ เอ็นจิ้นตัวปรับแต่งอันดับและเอ็นจิ้นการจัดอันดับสามารถรวมกันได้ โดยทั่วไป เอ็นจิ้นการจัดอันดับจะรวมส่วนประกอบซอฟต์แวร์ใดๆ ที่สร้างการจัดอันดับผลลัพธ์ของเอกสารหลังจากการสืบค้น นอกจากนี้ เอ็นจิ้นการจัดอันดับสามารถพอดีกับระบบไคลเอนต์ (หรือมากกว่า) ในระบบเซิร์ฟเวอร์
อีกตัวอย่างหนึ่งคือระบบดึงข้อมูล ระบบเซิร์ฟเวอร์ประกอบด้วยเอ็นจิ้นการจัดทำดัชนีและเอ็นจิ้นการให้คะแนน/อันดับ
ในระบบนี้ ระบบไคลเอ็นต์ประกอบด้วย:
- อินเทอร์เฟซผู้ใช้สำหรับนำเสนอการจัดอันดับ
- องค์ประกอบการติดตาม
- บันทึกการเลือกผลลัพธ์
- เอ็นจิ้นตัวปรับแต่งอันดับ/อันดับ
ตัวอย่างเช่น ระบบไคลเอนต์สามารถรวมเครือข่ายองค์กรของบริษัทและคอมพิวเตอร์ส่วนบุคคล ซึ่งปลั๊กอินของเบราว์เซอร์รวมเอาเอ็นจิ้นการจัดลำดับ/ตัวปรับแต่งอันดับ
เมื่อพนักงานในบริษัทเริ่มการค้นหาบนระบบเซิร์ฟเวอร์ เอ็นจิ้นการให้คะแนน/อันดับสามารถส่งคืนผลการค้นหาได้ การจัดอันดับเริ่มต้นหรือคะแนน IR จริงสำหรับผลลัพธ์ ปลั๊กอินของเบราว์เซอร์จะจัดอันดับผลลัพธ์ใหม่ตามการเลือกหน้าที่ติดตามสำหรับฐานผู้ใช้เฉพาะบริษัท
เทคนิคการจัดหมวดหมู่แบบสอบถาม
เทคนิคนี้สามารถทำได้ทางออนไลน์ (เป็นส่วนหนึ่งของการประมวลผลแบบสอบถาม) หรือในลักษณะออฟไลน์
ผลลัพธ์รูปภาพแรกตอบสนองต่อการสืบค้นครั้งแรกที่ได้รับ ภาพแรกแต่ละภาพเชื่อมโยงกับคำสั่งซื้อ (เช่น คะแนน IR) และข้อมูลพฤติกรรมของผู้ใช้ตามลำดับ (เช่น ข้อมูลการคลิก)
รูปภาพแรกจำนวนหนึ่งจะถูกเลือกโดยที่ตัววัดสำหรับข้อมูลพฤติกรรมที่เกี่ยวข้องสำหรับรูปภาพที่เลือกแต่ละรูปนั้นตรงตามเกณฑ์
รูปภาพแรกที่เลือกจะเชื่อมโยงกับคำอธิบายประกอบหลายรายการตามการวิเคราะห์เนื้อหาของรูปภาพแรกที่เลือก คำอธิบายประกอบรูปภาพสามารถคงอยู่ในคำอธิบายประกอบรูปภาพ
จากนั้นหมวดหมู่จะเชื่อมโยงกับคิวรีแรกตามคำอธิบายประกอบ
การเชื่อมโยงการจัดประเภทแบบสอบถามสามารถอยู่ในประเภทแบบสอบถาม
ผลลัพธ์รูปภาพที่สองตอบสนองต่อคิวรีที่สองที่เหมือนกันหรือได้รับคิวรีแรกแล้ว
(ถ้าไม่พบคิวรีที่สองในการจัดประเภทคิวรี คิวรีที่สองสามารถถูกแปลงหรือ "เขียนใหม่" เพื่อตรวจสอบว่ารูปแบบอื่นตรงกับคิวรีในการจัดประเภทคิวรีหรือไม่)
ในตัวอย่างนี้ แบบสอบถามที่สองจะเหมือนกับหรือสามารถเขียนใหม่เป็นแบบสอบถามแรกได้
ผลลัพธ์รูปภาพที่สองจะถูกจัดลำดับใหม่ตามการจัดหมวดหมู่การสืบค้นก่อนที่จะเชื่อมโยงกับการสืบค้นครั้งแรก
ค้นหาข่าวตรงไปยังกล่องจดหมายของคุณ
*ที่จำเป็น