• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Skrypt analizujący strone.

Object Storage Arubacloud
0 głosów
494 wizyt
pytanie zadane 3 czerwca 2015 w Inne języki przez PgK Obywatel (1,380 p.)
Witam,

Od pewnego czasu zastanawiam się nad próbą napisania programu który w jakiś sposób analizowałby dane zamieszczone na stronie internetowej. Mam trochę doświadczenia z C++, jakieś podstawy z HTML, CSS i umię tworzyć proste skrypty w bashu. Czy moglibyście mnie nakierować w jaki sposób mam się za coś takiego zabrać? W jaki sposób mam np. zaimportować kod źródłowy strony w celu poddania go analizie? Chciałbym napisać program który by np. analizował zmiany kursu walut, które są zamieszczone i aktualizowane na jakiejś stronie.

Program ten chciałbym napisać w perlu.

Pozdrawiam

1 odpowiedź

+1 głos
odpowiedź 3 czerwca 2015 przez Comandeer Guru (600,810 p.)
Czemu w Perlu akurat?

IMO szedłbym w JS i wykorzystał do tego phantom.js. Dlaczego? Bo to de facto pełnoprawna przeglądarka internetowa - z tym, że zamiast interfejsu graficznego dostajesz skryptowalne zachowanie ;)

Żeby poprawnie zinterpretować zawartość strony WWW należy wygenerować drzewko DOM. Problem pojawia się wówczas, gdy do wygenerowania tego drzewka potrzebna jest interpretacja JS (bo np. część danych dociągana jest Ajaksem). Wówczas Perl wymięknie, a phantom.js poradzi sobie wyśmienicie.

Jeśli natomiast chcesz traktować stronę po prostu jako kod i dane dociągane JS-em Cię nie interesują, to i tak lepiej zdać się na narzędzia generujące DOM, a nie babrać się z regexami: http://stackoverflow.com/a/1732454
komentarz 3 czerwca 2015 przez PgK Obywatel (1,380 p.)
Chciałem to napisać w perlu ponieważ mam zrobić jakiś prosty projekt w tym języku na zajęcia, a idea zawarta w moim poście może mi w tym pomóc. Dziękuję za Twoją odpowiedź, w wolnej chwili przeanalizuje dokładnie to co mi napisałeś.

Podobne pytania

+1 głos
3 odpowiedzi 3,628 wizyt
pytanie zadane 8 czerwca 2015 w Nasze projekty przez PgK Obywatel (1,380 p.)
0 głosów
0 odpowiedzi 85 wizyt
pytanie zadane 4 marca 2020 w Inne języki przez edwardkraweznik Dyskutant (9,930 p.)
+3 głosów
3 odpowiedzi 548 wizyt
pytanie zadane 25 lutego 2016 w Inne języki przez k!e# Bywalec (2,250 p.)

92,549 zapytań

141,392 odpowiedzi

319,519 komentarzy

61,935 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...