Парсер HTML файла |
Здравствуйте, гость ( Вход | Регистрация )
Парсер HTML файла |
++Norton++ |
21.11.2009, 22:52
Сообщение
#11
|
Студент Группа: Участник Сообщений: 98 Регистрация: 5.10.2008 Пользователь №: 380 Спасибо сказали: 0 раз(а) Репутация: 1 |
Спасибо за советы! Вот, кстати, пример куска хтмл файла:
Вот. Из такого кода нужно выдрать текст1, текст2, текст3 а также те числа, что идут после ссылки, т.е. в теге td align=right. Т.е. в данном примере после первой ссылки это 5701375, после второй 5701027, после третьей 2804612. Заранее еще раз спасибо! |
|
|
++Norton++ |
29.11.2009, 14:16
Сообщение
#12
|
Студент Группа: Участник Сообщений: 98 Регистрация: 5.10.2008 Пользователь №: 380 Спасибо сказали: 0 раз(а) Репутация: 1 |
Сделал регулярку, как посоветовал rcdimon. Получилось вроде этого:
Однако ничего не парсит С другой регуляркой работает нормально. Подскажите, дело в регулярке или нужно использовать не "rx.cap" а что-то другое? |
|
|
trdm |
29.11.2009, 20:10
Сообщение
#13
|
Дмитрий Трошин Группа: Участник Сообщений: 575 Регистрация: 12.1.2008 Пользователь №: 68 Спасибо сказали: 21 раз(а) Репутация: 6 |
Блин, я где-то нарывался на html парсер на основе бизона.
Вот бы его в либу оформить, можно было бы просто подключать к проекту. |
|
|
Текстовая версия | Сейчас: 16.1.2025, 1:26 |