Google Search Engine क्या है और यह कैसे काम करता है? क्या आपने कभी सोचा है की गूगल एक खुद वेबसाइट है और वह सभी websites का पता कैसे लगा लेती है? और क्या आप यह जानने के लिए भी उत्सुक है की गूगल काम कैसे करता है और करोडो वेबसाइट और उसके पेजेस को सर्च और मैनेज कैसे करता है? इसके अलावा यह Search Engine क्या होता हैं और क्या ये सिर्फ गूगल के पास है? तो ऐसे कही सारे सवालो के जवाब मैं आपको इस आर्टिकल में देने वाला हूँ जिससे आपको Google Search Engine क्या है और कैसे काम करता है इसके बारे में कोई भी डाउट ना रहे.
गूगल एक वेबसाइट है जिस पर आप जो भी सर्च करते हो वो गूगल आपको सर्च रिजल्ट पर दिखा देता है. पर क्या आपको पता है की गूगल हर वेबसाइट को स्कैन करके हमें नहीं दिखा सकता। वो उन्ही वेबसाइट को हमे दिखता है जो गूगल पर indexed है। यही आसान भाषा में कहे तो वह उन्ही websites को दिखा सकता है जो गूगल के डेटाबेस में या सर्वर पर स्टोर है।
कुछ ऐसी भी वेबसाइट है जो गूगल आसानी से इंडेक्स नहीं कर सकता इसलिए हमे कुछ चीजे सर्च करने से भी नहीं मिलती। क्यों की ऐसी वेबसाइट डार्क वेब और डीप वेब का हिस्सा होती है जो पुरे इंटरनेट का 96% ही भाग है और गूगल या बाकि सर्च इंजन जिनके बारे में हम आगे बात करेंगे वह लोगो को सिर्फ बचे हुए 4% वेबसाइट को ही दिखता है जो इन सर्च इंजन वेबसाइट पर इंडेक्स होती है।
डार्क वेब के बारे में जरूर पढ़े
Google Search Engine कैसे काम करता है
जब कोई व्यक्ति वेबसाइट को पब्लिश को करता है तो गूगल को उसे दिखाने में 4-5 दिन लग जाते है, क्यों की अब गूगल तो भगवान् है नहीं की वेबसाइट लॉंच हुयी और उसने उसे गूगल पर तुरंत दिखा दिया। इसके अलावा कही सारे वेबसाइट ओनर्स की ये भी कंप्लेंट रहती है की हमने 10 दिन पहले वेबसाइट बनाई है और गूगल पर हम जब सर्च करते है तो हमे वह सर्च रिजल्ट पर नहीं दिखाई देती।
तो इसके लिए आपको पहले तो ये समझना होगा की गूगल का जो प्रोग्राम है वो कैसे काम करता है। अब मानलो आपने एक वेबसाइट बनायीं जो आपने अभी अभी लॉंच की है तो इस केस मे अगर आप अपने वेबसाइट के बारे में गूगल को बताओगे नहीं तो उसे कैसे पता चलेगा की आपने वेबसाइट कब बनायी है और कब पब्लिश की है.
क्यों की आपने सिर्फ अपने ब्लॉग या वेबसाइट को पब्लिश किया है तो वह इंटरनेट पर मौजूद होगी ना की गूगल या किसी और सर्च इंजन पर और जब आप अपनी वेबसाइट को गूगल पर सर्च करते हो जो इंटरनेट पर पब्लिश है। तो जाहिर सी बात है की वेबसाइट आपको दिखेगी नहीं क्यों की अभी तक गूगल को आपने बताया ही नहीं की आपकी कोई वेबसाइट भी है.
गूगल उस वेबसाइट को तभी सर्च रिजल्ट पर दिखा सकता हैं जब उसे उस वेबसाइट के बारे मे बताया जाय।
फेसबुक का उदाहरण
उदाहरण के लिए मानलो की आप फेसबुक वेबसाइट पर लॉगिन है और आपने एक पेज या ग्रुप बनाया है जिसमे आपके लाखो फॉलोवर्स है और उसमे एक पोस्ट है जिसमे आपने वीडियो पब्लिश किया हुआ है जिसपर करोडो व्यूज है।
अब यहां पर आपने पेज किस वेबसाइट पर बनाया है? फेसबुक! पर। तो जब आप आपके पेज को गूगल पर सर्च करते हो तो आपका fb पेज गूगल पर आसानी से दिख जाता है क्यों की फेसबुक ने आपके पेज को, जो फेसबुक वेबसाइट पर मौजूद है उसे गूगल में इंडेक्स कराया है उसी वजह से आपको वह पेज गूगल पर दिखाई देता है.
लेकिन जब आपका जो वीडियो जिसपर लाखो करोडो व्यूज है उसे जब आप सर्च करते हो तब वह गूगल पर नहीं दिखाई देता। क्यों की आपने उस पर्टिकुलर पेज को फेसबुक वेबसाइट पर बनाया है और उस वेबसाइट पर जो भी पब्लिश होगा तो उसकी अथॉरिटी फेसबुक को होगी ना की गूगल को. और अगर उसने वीडियो के बारे में गूगल को बताया ही नहीं तो भगवान् भी ऊपर से आकर गूगल पर सर्च करेंगे तो उन्हें भी वह वीडियो नहीं दिखाई देगा। कहने का मतलब यह है की फेसबुक ने आपके पेज को इंडेक्स कराया है और जो पेज पर फोटोज, वीडियोस पब्लिश होते है उसे no-index कर सिर्फ अपनी वेबसाइट तक ही सिमित रखा है और वही कारण है की आपको वह वीडियो सर्च रिजल्ट पर नहीं दिखाई दे रहा.
वेबसाइट के बारे में गूगल को कैसे पता चलता है
अगर आप किसी वेबसाइट के ओनर है तो आपको गूगल को अपनी वेबसाइट के बारे में बताने के लिए अपने वेबसाइट या ब्लॉग का URL गूगल में सबमिट करके उसका sitemap यानि आपके ब्लॉग पर जितने भी पोस्ट पब्लिश होते है और जो नए पब्लिश हुए है उनकी लिस्ट को गूगल सर्च कंसोल में डालना पड़ता है तभी गूगल आपकी वेबसाइट को स्कैन करके पता लगता है की हां भाई ऐसी भी कोई वेबसाइट है जो हमे गूगल सर्च पर दिखानी है.
आपके वेबसाइट को सर्च कंसोल में सबमिट करने के लिए निचे की लिंक को फॉलो करे
अब सवाल यह आता है की लाखो करोडो वेबसाइट इंटरनेट पर है, हर रोज कितने पोस्ट पब्लिश होते है तो गूगल को सब वेबसाइट के पेज के बारे में कैसे पता चलता होगा और वह इतने लाखो लिंक्स को हर मिनट हर सेकंड कैसे स्कैन करता होगा?
Google Search Engine Spyder (Crawlers)
अब आपके मन एक सवाल आ रहा होगा की गूगल के पास जो अलग अलग वेबसाइटों की लिस्ट है जो उन ओनर्स ने गूगल के पास सबमिट की है तो उन लाखो वेबसाइट के करोडो पेजेस की लिस्ट, गूगल बना कर सर्च रिजल्ट में कैसे rank करता होगा? क्योंकि गूगल खुद एक वेबसाइट है तो यह कैसे पॉसिबल होता है.
तो गूगल ने उसके लिए कुछ प्रोग्राम्स बनाए, अलग अलग एल्गोरिथम बनाये है जिसे गूगल यूज़ पेज रॅंकिंग के लिए यूज करता है। और ऐसा करने के लिए गूगल के पास खुदका बनाया एक प्रोग्राम (अल्गोरिदम) है जिसका नाम है स्पाइडर या ब्लॉग्गिंग में कहे तो crawlers.
जब भी हम search console में वेबसाइट को सबमिट करते है तब ये जो स्पाइडर है या बोल सकते हो ये जो कोडिंग है, वो सबसे पहले उस एक पर्टिकुलर वेबसाइट के अंदर जाएगा और वहा पर ये ढूंढेगा की पूरी वेबसाइट के अंदर कितने हाइपर लिंक्स (External links) है जो कि दूसरी वेबसाइट को point कर रहे हैं।
मानलो उस प्रोग्राम या spyder को वहा 10 वेबसाइट के लिंक मिल गए जो दूसरी वेबसाइट को पॉइंट कर रहे है। तो अब ये जो स्पाइडर है वो ऑटोमेटिकली इन दस वेबसाइट के अंदर जाएगा। फिर उन 10 वेबसाइट को स्कैन करेगा फिर से देखेगा कि वे पर्टिकुलर webisites कितने और दूसरी website को लिंक कर रहे है। इसे unsleepy स्पाइडर भी कहा जाता है क्यों की यह कभी भी नहीं रुकता, जो पेज मिला उसे स्कैन करते ही रहता है। इस तरीके से ये १० वेबसाइट, फिर और १० वेबसाइट, फिर और 10. तो ऐसे automatically लूप में चलते रहता है।
अब आपको ये बात ध्यान रखनी है की वह स्पाइडर सिर्फ उन वेबसाइट के लिंक्स या पूरी वेबसाइट को स्कैन करेगा जो गूगल में इंडेक्स है।
अब ऐसा करते वक्त वोह सिर्फ उसे स्कैन ही नहीं करता वल्कि जो जो website उसको मिलती जा रही है उस वेबसाइट का टाइटल, डिस्क्रिप्शन, URL मतलब की आपकी पूरी वेबसाइट, लिंक्स के साथ साथ पूरी इनफार्मेशन को अपने डेटाबेस में स्टोर करते जायेगा।
तो ऐसे मिलियन ऑफ़ स्पाइडर है जो गूगल सर्च इंजन पर घूम रहे है और वेबसाइट को स्कैन कर रहे है और यही वजह है की हमने अगर किसी वेबसाइट को अपडेट किया या कोई नई पोस्ट डाली तो गूगल को तुरंत पता चल जाता है। उसकी सारी डिटेल ऑटोमेटिकली उनके स्पाइडर स्कैन करते है और गूगल के डेटाबेस में अपडेट करते है। ऐसा करने के लिए गूगल के पास बड़े बड़े सर्वर्स रहते है जहा ये सारी इनफार्मेशन स्टोर होती है।
आसान तरीके से कहे तो गूगल के अंदर जो क्रॉलर्स (स्पाइडर) है उनका काम है वेबसाइट को स्कैन करना और इंडेक्सिंग यानि स्कैन हुयी वेबसाइट के पेजेस को सर्च रिजल्ट पर दिखाना।
Crawlers – क्रॉलर्स यानि की स्कैन करना ढूंढ़ना।
Indexing – इंडेक्सिंग मतलब उस आटोमेटिक प्रोग्राम को या उस स्पाइडर को ढूंढ़ते वक्त जो जो वेबसाइट की अपडेटेड लिंक्स, इनफार्मेशन, नए नए पेज मिलते है उसे सर्च रिजल्ट पर दिखाना।
Google पर वेबसाइट Rank कैसे होती है
हमने ऊपर क्रॉलर्स यानि सर्वर साइड में क्या होता है ये तो समझ लिया अब हम गूगल उस सारी स्कैन की हुयी लिस्ट ऑफ़ वेबसाइट को रैंक कैसे करता है यह समझ लेते है। मतलब के क्लाइंट साइड की जानकारी जो हम सर्च रिजल्ट पर देखते है।
अब मानलो मैंने सर्च किया On Page SEO। अब स्कैन करते वक्त ये जो कीवर्ड है ये गूगल सबसे पहले अपने सर्वर में ढूंढेगा फिर उसको अपने सर्वर के अंदर जिस भी वेबसाइट के अंदर On Page SEO keyword मिलता है उस वेबसाइट को एक sequence में रखेगा।
इसके लिए वो सर्वर में स्टोर जितने भी वेबसाइट है उसके जितने भी पेजेस है उसके टाइटल, डिस्क्रिप्शन, या फिर कहीं भी वेबसाइट के इनफार्मेशन में ढूढ़ते जायेगा। और ऐसी कौनसी वेबसाइट है जिसमें ये जो कीवर्ड है इसमें तीनों मैच हो रहे है, या दो मैच हो रहे है इस हिसाब से डेटाबेस में एक लिस्ट बनाएगा।
अब इस फाइनल लिस्ट को गूगल वापस से स्कैन करेगा और 200 से 500 अलग अलग questions पूछेगा जैसे की:
- क्या वो keyword टाइटल में आ रहा है?
- क्या वो कीवर्ड डिस्क्रिप्शन में आ रहा है?
- क्या उस वेबसाइट के अंदर ऐसी कुछ चीजें हैं जो कि कीवर्ड से मैच करती हैं?
- उस keyword का जो मीनिंग है वह websites निकाल पा रही है या नहीं।
- ये जो एक वेबसाइट मैंने देखी या उसे पढ़ने के लिए मैंने उस पर्टिकुलर वेबसाइट को ओपन किया, इसके अंदर जो अलग अलग वेबसाइटों के लीक्स है उसमे वह कीवर्ड है या नहीं।
- उसमे backlinks आ रही है या नहीं
- क्या वो अथॉरिटी वेबसाइट है?
- वेबसाइट की domain authority क्या है?
- URL authority क्या है या वेबसाइट की Age क्या है?
- उस वेबसाइट का जो ओनर है वो verified है या नहीं।
ऐसे बहोत सारे questions जो हैं वो गूगल पूछेगा और इस हिसाब से जितनी वेबसाइटें होंगी उन सब वेबसाइट को एक सिक्वेंस में बना लेगा कि उसको पहले क्या दिखाना है दूसरा क्या दिखाना है, तीसरा क्या दिखाना है। और ऐसा करने के बाद वह उन लिस्ट में से सबसे टॉप टेन रिजल्ट्स जो हैं वो गूगल आपको निकाल के ले आएगा।
मतलब की सबसे पहले वेबसाइट सर्वर से scan होंगी फिर आपने जो keyword गूगल पर सर्च किया है उसके हिसाब से वह सारे वेबसाइट के अंदर कीवर्ड को ढूंढेगी। और जिस जिस वेबसाइट में यह कीवर्ड अच्छेसे डाला हुआ है उसके हिसाब से पेज को रैंक करेगी।
अगर आप एक ब्लॉगर है तो आपको यह समझने आगया होगा की गूगल कैसे काम करता है और आपके वेबसाइट में कीवर्ड का कितना महत्व होता है। यदि आप फ्री में गूगल पर कीवर्ड रिसर्च करना चाहते है तो निचे की लिंक को ओपन करके Keyword research कैसे करनी है यह सिख सकते है-
Google Search Engine में कुछ वेबसाइट रैंक क्यों नहीं होती
यहां पर बहोत सारी चीजें होती है जिसकी वजह से वेबसाइट की ranking up-down होती रहती है। किसी वेबसाइट की ranking, traffic के हिसाब से, CTR के हिसाब से, उस सर्च किये पर्टिकुलर कीवर्ड के सर्च वॉल्यूम के हिसाब से होती है।
तो यहां पर ये जो CTR हो ता है यानि Click Through Rate इसमें मानलो मैंने गूगल पर कुछ सर्च किया और उस कीवर्ड पर मुझे बहुत सारी वेबसाइटें दिखाई दी पर मैंने ऊपर के वेबसाइट को स्किप करके एक वेबसाइट को ओपन किया जो 7 नंबर पे थी।
तो यहां पर अगर मैं उसी website को बार बार open करूँगा या लोग बार बार उस वेबसाइट में जाकर ही इनफार्मेशन को पढ़ेंगे तो गूगल को ऐसा लगेगा कि सब लोग स्किप करके उसी पर जा रहे है. इसका मतलब यह है की वो वेबसाइट लोगो को सही जानकारी दे रही है और ऐसेही अगर उस लिंक पर लोग क्लिक करते रहे तो उस वेबसाइट की डोमेन अथॉरिटी बढ़ेगी और साथी में CTR भी बढ़ेगा जिसकी वजह वो वेबसाइट का पेज गूगल सर्च रिजल्ट में rank कर देगा।
गूगल का ये जो प्रोसेस है वो सिर्फ विजिट पर नहीं बल्कि कही और फैक्टर पर भी डिपेंड करता है जैसे-
- CTR (क्लिक थ्रू रेट)
- Keyword Placement
- Image Optimization
- पोस्ट में डाली गयी जानकारी की लेंथ
- Title, Meta Description, Focus Keyword
- Headings (h1, h2, h3 etc)
- Backlinks
- Outbound (External) links और Inbound (Internal) Links
- Views
- SEO friendly URL
- Average Session Timing (यानि पर्टिकुलर उस दिन में जीने लोगो ने विजिट किया वो कितनी देर तक वेबसाइट पर रहे)
- Unique Information
इसमें आपको पता लग गया होगा की गूगल का algorithm इन चीजों पर भी डिपेंड करता हैं इसलिए जब भी कोई वेबसाइट पर आप जो कुछ पब्लिश कर रहे उसमे आपको इन चीजों का भी ध्यान रखना होता है, तभी आपकी वेबसाइट गूगल पर रैंक करती है।
Google Search Engine पैसा कैसे कमाता है
यहां पर गूगल एक चीज और बोलता है की ये जो रैंकिंग है उसे दिखाने के लिए गूगल कोई भी पैसे नहीं लेता है। इसके अलावा वेबसाइट की रैंकिंग को इम्प्रूव करने के लिए, उसे अपडेट करने के लिए या फिर आप अपने website में अपडेट कर रहे हो तो गूगल वेबसाइट के ओनर से पैसे नहीं मांगता। जैसे की वो स्पाइडर को जल्दी आपकी वेबसाइट पर भेजेगा ताकि वो स्कैन करके उस पर्टिकुलर कीवर्ड पर सर्च हुए वेबसाइट में आपके पेज को रैंक में दिखाए।
इन चीजों के लिए google पैसा नहीं लेता है और ये जो सारी क्लाइंट साइड की चीजे मैंने आपको बताई है वो गूगल ट्रांसपेरेंसी के साथ करता है।
लेकिन हां दोस्तों गूगल एक वेबसाइट है और उनके पास इतने सारे सर्वर्स है जो करोडो डॉलर्स के है और उनके maintainance के लिए, अपने employe के salary के लिए वो कीवर्ड पे ads भी दिखाता है। अब जाहिर सी बात की वोह सबकुछ फ्री में देगा तो खायेगा क्या।
यहाँ पर आपको और एक बात ध्यान में रखनी है की आपको कोई भी पैसे गूगल को नहीं देने पड़ते। जो कोई कंपनी या व्यक्ति गूगल पर advertising करना चाहता है उसे ही गूगल को पैसे देने पडते है अपने वेबसाइट की एड्स लगाने के लिए।
इस तरह से गूगल अपने ads से सारा पैसा निकालता है। ये जो ऐड है वो पर्टिकुलर keyword के हिसाब से ही गूगल राइट साइड में भी दिखाता है और top साइड में भी दिखाता है. मतलब की गूगल ऐड से पैसे कमा के हमें जो रिजल्ट देता है वह फ्री में देता है।
गूगल को वेबसाइट क्रॉल करने से कैसे रोके
वेबसाइट पर स्पाइडर को ब्लॉक करना है तो गूगल एक मैथड भी देता है जिसे robots.txt कहते है। यह एक टेक्स्ट फाइल होती है जिसमे वेबसाइट को आपको सर्च रिजल्ट में दिखाना है या नहीं उसका कोड होता है.
किसी भी वेबसाइट की रोबोट फाइल चेक करने के लिए आप अगर वेबसाइट के URL के सामने robots.txt लिखेंगे तो आपको उसका कोड आसानी से दिख जायेगा।
मेरे वेबसाइट की robots.txt फाइल – http://discoverinhindi.in/robots.txt
आपकी वेबसाइट में अगर यह कोड होगा तो ऑटोमेटिकली जब स्पाइडर आएगा पहले इसको देखेगा अगर उसमें आपने वेबसाइट को allow किया होगा तभी वो आपकी वेबसाइट में घुसेगा और स्कैन करेगा। और अगर वो वेबसाइट के अंदर नहीं गया तो उस particular website में क्या है वो गूगल को पता नहीं चलेगा। इसकी वजह से Google search engine रिजल्ट के अंदर वो पर्टिकुलर वेबसाइट भी नहीं दिखेगी।
अब कभी ये मत सोचना कि गूगल में नहीं मिला तो कहीं और नहीं मिलेगा। यह वेबसाइट है और उसके स्पाइडर किसी वेबसाइट में नहीं जा पाए, इन्फोर्मेशन को scan नहीं कर सके तो गूगल में वोह चीजे नहीं मिलेगी।
Google का Advance Algorithm
यहां पर आजकल गूगल जो है वो और भी एडवांस हो गया है। क्यों की अब गूगल हमारी वेबसाइट को scan करके अपने एडवांस प्रोग्राम के चलते सही इनफार्मेशन को गूगल पर ही दिखा देता है।
जैसे अगर कोई सर्च लेता है prime minister of india तो गूगल हमारी किसी रैंक हुयी वेबसाइट को स्कैन करेगा, जानकारी को ढूंढेगा और गूगल पर ही उसे दिखायेगा ताकि सर्च करने वाले को कही और ढूढ़ना ना पड़े और वो ज्यादा से ज्यादा Google search engine को ही यूज करे।
आजकल गूगल का मेन मोटिव ये है कि जो चीजें हम सर्च कर रहे उसका रिजल्ट हमे गूगल के सर्च रिजल्ट में ही मिले। जैसे की अगर आप लिखोगे Height या Age of अमिताभ बच्चन तो आपको ये सर्च रिजल्ट पर ही मिल जाएगा।
अब गूगल का ये Artificial Intelligence प्रोग्राम इन सारी चीजें समझने लगा है। उसका मीनिंग निकाल के उसने ऑटोमेटिकली जो डेटा वेबसाइट पहले से है उसी डेटा को यूज करके उसी के सर्च रिजल्ट पर दिखा रहा है।
आपको जानकार हैरानी होगी की आज की तारीख में दुनिया में जितना भी डेटा होगा उससे ज्यादा डेटा गूगल के पास है, जैसे की-
- हमारी लोकेशन
- हमारी प्रोफाइल (नाम, पता सबकुछ)
- पेमेंट इनफार्मेशन
- जो हम सर्च कर रहे है उसकी जानकारी
- जो हमने सर्च की है उसकी जानकारी
- आपकी पसंद-नापसंद के हिसाब से सर्च रिजल्ट दिखाना।
पहले के ज़माने में यह होता था की हम लोग गूगल को चलाते थे लेकिन अब गूगल हमे चला रहा है। पहले हम लोग सारी Information google को दे देते लेकिन आज गूगल के पास हमारी सारी जानकारी है जो हम सोच भी नहीं सकते।
हमारी जानकारी कैसे गयी कब गयी ये सोचने आपको की जरूरत नहीं क्यों की हम जो मोबाइल यूज करते है और उसमे जो सर्च करते है वो सब गूगल का ही तो है।
उम्मीद है आपको मेरी Google Search Engine के बारे में बताई जानकारी अच्छी लगी हो और अगर आपको यह आर्टिकल सचमे पसंद आया हो, आपको इससे कुछ सिखने को मिला हो तो इसे अपने दोस्तों के साथ या सोशल मीडिया पर जरूर शेयर करे जिसे सभी को Google Search Engine के बारे में पता चले.
Thank you for information..