Надо написать html браузер |
Здравствуйте, гость ( Вход | Регистрация )
Надо написать html браузер |
bynet |
13.11.2008, 20:38
Сообщение
#1
|
Студент Группа: Участник Сообщений: 69 Регистрация: 17.3.2008 Из: Belarus Пользователь №: 124 Спасибо сказали: 0 раз(а) Репутация: 0 |
Мне надо написать html браузер. При написании его нельзя использовать практически никаких библиотек. Тоесть на читом visual studio. Без всяких STL, MFC. Но разрешили на qt,
Решил реализовывать использую регулярные выражения. Но стандартную библиотеку для работы с регуляными выражениями мне использовать нельзя. Как лучше организовать регулярные выражения(алгоритм)? Или может лучше будет организовать другим способом? |
|
|
ViGOur |
13.11.2008, 22:46
Сообщение
#2
|
Мастер Группа: Модератор Сообщений: 3296 Регистрация: 9.10.2007 Из: Москва Пользователь №: 4 Спасибо сказали: 231 раз(а) Репутация: 40 |
Столкнувшись с написанием конвертера HTML в WIKI формата, могу сказать точно, что регулярные выражения дял правильного разбора HTML использовать нельзя!
Например с помощью регулярного выражения правильно разобрать конструкцию с произвольной вложенностью невозможно:
небольшую дискусию об этом можно прочитать в теме: Разбор трехэтажных вложенных тегов, <ol> <li>... То же относится к тэгам table или div, но с ними проще в отличии от приведенной мной выше конструкции. Поэтому думаю тебе стоит написать свой парсер, который в принципе для твоих нужд будет написать не сложно. |
|
|
bynet |
13.11.2008, 22:57
Сообщение
#3
|
Студент Группа: Участник Сообщений: 69 Регистрация: 17.3.2008 Из: Belarus Пользователь №: 124 Спасибо сказали: 0 раз(а) Репутация: 0 |
|
|
|
bobdva |
13.11.2008, 23:13
Сообщение
#4
|
Студент Группа: Участник Сообщений: 29 Регистрация: 2.10.2008 Из: Москва Пользователь №: 377 Спасибо сказали: 0 раз(а) Репутация: 0 |
Мне надо написать html браузер. При написании его нельзя использовать практически никаких библиотек. Тоесть на читом visual studio. Без всяких STL, MFC. Но разрешили на qt, Решил реализовывать использую регулярные выражения. Но стандартную библиотеку для работы с регуляными выражениями мне использовать нельзя. Как лучше организовать регулярные выражения(алгоритм)? Или может лучше будет организовать другим способом? судя по всему, с вашим пониманием проблемы курить и курить вам множество литературы, и про конечные автоматы, и про парсеры, да и базовые возможности qt тоже бы не плохо было бы посмотреть чуть детальней, чем писать свой HTML браузер . Кстати, WebKit в составе Qt не спасёт отца русской демократии ? FYI, Уже в m$ потенциально посматривают в сторону WebKit'а... Сообщение отредактировал bobdva - 13.11.2008, 23:15 |
|
|
bynet |
13.11.2008, 23:22
Сообщение
#5
|
Студент Группа: Участник Сообщений: 69 Регистрация: 17.3.2008 Из: Belarus Пользователь №: 124 Спасибо сказали: 0 раз(а) Репутация: 0 |
Мне надо написать html браузер. При написании его нельзя использовать практически никаких библиотек. Тоесть на читом visual studio. Без всяких STL, MFC. Но разрешили на qt, Решил реализовывать использую регулярные выражения. Но стандартную библиотеку для работы с регуляными выражениями мне использовать нельзя. Как лучше организовать регулярные выражения(алгоритм)? Или может лучше будет организовать другим способом? судя по всему, с вашим пониманием проблемы курить и курить вам множество литературы, и про конечные автоматы, и про парсеры, да и базовые возможности qt тоже бы не плохо было бы посмотреть чуть детальней, чем писать свой HTML браузер . Кстати, WebKit в составе Qt не спасёт отца русской демократии ? FYI, Уже в m$ потенциально посматривают в сторону WebKit'а... Я спрашиваю как это организовать... Тоесть как парсить на словах.. |
|
|
ViGOur |
14.11.2008, 0:09
Сообщение
#6
|
Мастер Группа: Модератор Сообщений: 3296 Регистрация: 9.10.2007 Из: Москва Пользователь №: 4 Спасибо сказали: 231 раз(а) Репутация: 40 |
Кстати, WebKit в составе Qt не спасёт отца русской демократии ? На сколько я знаю это ему в универе дали задание, а там как известно халява вроде Webkit'a не пройдет. Тоесть как я понимаю достаточно сделать вывод результата в консоль и не более того. Я спрашиваю как это организовать... Тоесть как парсить на словах.. У тебя есть массив символов, в цикле проходишь его и проверяешь на наличие открывающегося тэга или закрывающегося, дальше отображаешь даныне в зависимости от того, что за тэг.
|
|
|
bobdva |
14.11.2008, 8:58
Сообщение
#7
|
Студент Группа: Участник Сообщений: 29 Регистрация: 2.10.2008 Из: Москва Пользователь №: 377 Спасибо сказали: 0 раз(а) Репутация: 0 |
Кстати, WebKit в составе Qt не спасёт отца русской демократии ? На сколько я знаю это ему в универе дали задание, а там как известно халява вроде Webkit'a не пройдет. Тоесть как я понимаю достаточно сделать вывод результата в консоль и не более того. а чем SAX Parser не устраивает для данной задачи ? сомневаюсь, что потребуется делать анализ html с ошибками с точки зрения xml (не закрытые теги, одиночные теги типа <br> и т.п) Сообщение отредактировал bobdva - 14.11.2008, 8:59 |
|
|
Litkevich Yuriy |
14.11.2008, 9:59
Сообщение
#8
|
разработчик РЭА Группа: Сомодератор Сообщений: 9669 Регистрация: 9.1.2008 Из: Тюмень Пользователь №: 64 Спасибо сказали: 807 раз(а) Репутация: 94 |
а чем SAX Parser не устраивает для данной задачи ? раз уж человеку STL нельзя использовать значит суть задания - построить синтаксический анализатор, читай SAX.Поэтому думаю тебе стоит написать свой парсер, который в принципе для твоих нужд будет написать не сложно. СогласенЯ предлагаю сделать отдельный клас в стиле SAX-reader'а который будет обнаруживать во входной символьной последовательности: 1) открывающийся тэг 2) закрывающийся тэг 2) ошибку |
|
|
kuler |
14.11.2008, 10:33
Сообщение
#9
|
Танцор диско Группа: Участник Сообщений: 441 Регистрация: 11.9.2008 Из: Москва Пользователь №: 289 Спасибо сказали: 6 раз(а) Репутация: -1 |
|
|
|
Litkevich Yuriy |
14.11.2008, 11:06
Сообщение
#10
|
разработчик РЭА Группа: Сомодератор Сообщений: 9669 Регистрация: 9.1.2008 Из: Тюмень Пользователь №: 64 Спасибо сказали: 807 раз(а) Репутация: 94 |
|
|
|
Текстовая версия | Сейчас: 30.12.2024, 21:22 |