क्या AJAX का उपयोग करने वाली वेबसाइटों से गतिशील सामग्री को स्क्रैप करने के लिए स्क्रैपी का उपयोग किया जा सकता है?

| | | | |

मैं हाल ही में पायथन सीख रहा हूं और एक वेब-स्क्रैपर बनाने में अपना हाथ लगा रहा हूं। यह कुछ भी फैंसी नहीं है; इसका एकमात्र उद्देश्य एक सट्टेबाजी वेबसाइट से डेटा प्राप्त करना है और इस डेटा को एक्सेल में डाल देना है। गंदगी के आसपास। हालांकि मैं एक मुद्दे पर एक बड़ी बाधा का सामना कर रहा हूं। यदि कोई साइट घोड़ों की एक तालिका लोड करती है और मौजूदा सट्टेबाजी की कीमतों को सूचीबद्ध करती है तो यह जानकारी किसी स्रोत फ़ाइल में नहीं है। सुराग यह है कि यह डेटा कभी-कभी लाइव होता है, संख्याओं को स्पष्ट रूप से अपडेट किया जाता है कुछ दूरस्थ सर्वर से। मेरे पीसी पर एचटीएमएल में बस एक छेद है जहां उनके सर्वर सभी दिलचस्प डेटा के माध्यम से आगे बढ़ रहे हैं जो मुझे चाहिए।

अब गतिशील वेब सामग्री के साथ मेरा अनुभव कम है, इसलिए यह बात कुछ है मुझे अपना सिर घुमाने में परेशानी हो रही है।

मुझे लगता है कि जावा या जावास्क्रिप्ट एक कुंजी है, यह अक्सर पॉप अप होता है।

स्क्रैपर केवल एक ऑड्स तुलना इंजन है। कुछ साइटों में एपीआई होते हैं, लेकिन मुझे उन लोगों के लिए इसकी आवश्यकता होती है जो नहीं करते हैं। मैं पाइथन 2.7 के साथ स्क्रैपी लाइब्रेरी का उपयोग कर रहा हूं

अगर यह प्रश्न बहुत खुला है तो मैं क्षमा चाहता हूं। संक्षेप में, मेरा प्रश्न है: इस गतिशील डेटा को स्क्रैप करने के लिए स्क्रैपी का उपयोग कैसे किया जा सकता है ताकि मैं इसका उपयोग कर सकूं? ताकि मैं इस बेटिंग ऑड्स डेटा को रीयल-टाइम में परिमार्जन कर सकूं?