crossplatform.ru

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Ответить в данную темуНачать новую тему
> Загрузка исходника html страницы
RazrFalcon
  опции профиля:
сообщение 16.7.2010, 0:40
Сообщение #1


Zombie Mod
*****

Группа: Участник
Сообщений: 1654
Регистрация: 24.5.2010
Из: Харьков
Пользователь №: 1752

Спасибо сказали: 64 раз(а)




Репутация:   212  


Пример: нужно узнать рейтинг фильма на "кинопоиске" (ссылка на страницу имеется).
С чего начать, совсем непонятно.
Раскрывающийся текст
<div style="color: #f60; font-family: tahoma; font-size: 25px"><a href="/level/83/film/301/" class="continue" style="background: url(/images/dot_or.gif) 0 93% repeat-x; font-weight: normal !important; text-decoration: none">8.496<span style="font:100 14px tahoma, verdana">&nbsp;&nbsp;44&nbsp;168</span></a>
</div>
8.496 как раз и надо получить. :(
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Litkevich Yuriy
  опции профиля:
сообщение 16.7.2010, 0:43
Сообщение #2


разработчик РЭА
*******

Группа: Сомодератор
Сообщений: 9669
Регистрация: 9.1.2008
Из: Тюмень
Пользователь №: 64

Спасибо сказали: 807 раз(а)




Репутация:   94  


ты не знаешь как загрузить страницу?
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
RazrFalcon
  опции профиля:
сообщение 16.7.2010, 0:47
Сообщение #3


Zombie Mod
*****

Группа: Участник
Сообщений: 1654
Регистрация: 24.5.2010
Из: Харьков
Пользователь №: 1752

Спасибо сказали: 64 раз(а)




Репутация:   212  


Цитата(Litkevich Yuriy @ 16.7.2010, 0:43) *
ты не знаешь как загрузить страницу?
Нуу... и это тоже. Но мне то ее открывать и просматривать не нужно, только текст нужен.
PS: тут ниже есть моя тема, я там пытался передать сообщение через инет (переделка Network Chat Client на инет), но дальше лана изначального так нечего и не вышло. :(
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
ufna
  опции профиля:
сообщение 16.7.2010, 9:33
Сообщение #4


Активный участник
***

Группа: Участник
Сообщений: 362
Регистрация: 24.5.2008
Из: Курган/СПб
Пользователь №: 182

Спасибо сказали: 29 раз(а)




Репутация:   5  


QNetworkAssistant + QNetworkReply

Примеры есть повально в тот же гугле.

А как разбирать страницу на кусочки - это уже на тему парсеров, тут я обычно делаю слишком топорно, если позволяет сайт ))
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
RazrFalcon
  опции профиля:
сообщение 9.8.2010, 16:11
Сообщение #5


Zombie Mod
*****

Группа: Участник
Сообщений: 1654
Регистрация: 24.5.2010
Из: Харьков
Пользователь №: 1752

Спасибо сказали: 64 раз(а)




Репутация:   212  


Можно какой то, любой, пример. Мучаюсь-мучаюсь а ничего не выходит толкового.
Как просто вывести xml код веб-страницы в тот же QTextEdit.
Заранее спасибо всем откликнувшимся.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
kwisp
  опции профиля:
сообщение 19.8.2010, 9:30
Сообщение #6


астарожна ынтжинэр
*****

Группа: Участник
Сообщений: 1404
Регистрация: 26.11.2008
Из: ТаганрогРодинаЧехова
Пользователь №: 435

Спасибо сказали: 113 раз(а)




Репутация:   23  


вышло что нибудь толковое или нет?
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
RazrFalcon
  опции профиля:
сообщение 26.8.2010, 23:12
Сообщение #7


Zombie Mod
*****

Группа: Участник
Сообщений: 1654
Регистрация: 24.5.2010
Из: Харьков
Пользователь №: 1752

Спасибо сказали: 64 раз(а)




Репутация:   212  


Цитата(kwisp @ 19.8.2010, 9:30) *
вышло что нибудь толковое или нет?

Да ничего совсем.
http://www.forum.crossplatform.ru/index.php?showtopic=5215
тут разбирался с работой с инетом, если что, там есть и пример выложенный.
А на счет скачки то кроме wget(под Linux, хотя и в Win можно) никак пока. Качал страницы и потом открывал их уже в QT. Пеньколодисто конечно, но другого ничего так и не вышло. К слову, страницу кинозала не скачать, стоит защита от скачивания сайта, типа чтоб сервера не перегружались ну и инфу не тырили на свои рекламо-сайты. Есть статьи для wget, типа обход запрета через шифровку под браузер, но так ничего и не вышло у меня.
Видел такое уже здесь некоторые спрашивали, но так до сих пор без ответа.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
kwisp
  опции профиля:
сообщение 27.8.2010, 9:03
Сообщение #8


астарожна ынтжинэр
*****

Группа: Участник
Сообщений: 1404
Регистрация: 26.11.2008
Из: ТаганрогРодинаЧехова
Пользователь №: 435

Спасибо сказали: 113 раз(а)




Репутация:   23  


RazrFalcon,
скинь сайт этого кинозала.
если будет время на работе посомтрим что там.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
RazrFalcon
  опции профиля:
сообщение 27.8.2010, 10:41
Сообщение #9


Zombie Mod
*****

Группа: Участник
Сообщений: 1654
Регистрация: 24.5.2010
Из: Харьков
Пользователь №: 1752

Спасибо сказали: 64 раз(а)




Репутация:   212  


Цитата(kwisp @ 27.8.2010, 9:03) *
скинь сайт этого кинозала.

Ступил :lol: :lol: :lol:
Кинопоиск а не кинозал, http://www.kinopoisk.ru/level/1/film/397220/
вот к примеру нужно здесь узнать рейтинг, который выглядит как X.XXX
Ну и похожее можно повторить с http://www.imdb.com/title/tt0791205/
Некоторые интересовались возможностью узнать свой ip с http://www.whatismyip.com/
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
kwisp
  опции профиля:
сообщение 27.8.2010, 11:12
Сообщение #10


астарожна ынтжинэр
*****

Группа: Участник
Сообщений: 1404
Регистрация: 26.11.2008
Из: ТаганрогРодинаЧехова
Пользователь №: 435

Спасибо сказали: 113 раз(а)




Репутация:   23  


RazrFalcon,
ну самое быстрое но не самое красивое решение это использовать QWebView. загружать туда страничку - сохранять и парсить. это по быстрому.
по медленному это ethereal`ом или другим снифером. посмотреть в каком виде отправляется запрос на сервер какие поля какие значения имеют из браузера. сделать такой же запрос QNetworkAccessManager`ом.

П.С.
ставлю wireshark
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение

2 страниц V   1 2 >
Быстрый ответОтветить в данную темуНачать новую тему
Теги
Нет тегов для показа


3 чел. читают эту тему (гостей: 3, скрытых пользователей: 0)
Пользователей: 0




RSS Текстовая версия Сейчас: 1.12.2024, 23:50