crossplatform.ru

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Ответить в данную темуНачать новую тему
> Разбор текста на составляющие, на любом языке
ViGOur
  опции профиля:
сообщение 26.9.2010, 21:20
Сообщение #1


Мастер
******

Группа: Модератор
Сообщений: 3296
Регистрация: 9.10.2007
Из: Москва
Пользователь №: 4

Спасибо сказали: 231 раз(а)




Репутация:   40  


Есть примерно такой текст:
Цитата
А текст
А0 текст
А1 текст
...
А00 текст
А01 текст
...
А000 текст
А001 текст
...
Б текст
Б0 текст
...
Б00 текст
...
Б000 текст
...
Нужно его разложить по файлам и директориям соответсвенно:
Цитата
./А/file -> текст
./А/0/file -> текст
./А/1/file -> текст
...
./А/0/0/file -> текст
./А/0/1/file -> текст
...
./А/0/0/0/file -> текст
./А/0/0/1/file -> текст
...
./Б/file -> текст
./Б/0/file -> текст
...
./Б/0/0/file -> текст
...
./Б/0/0/0/file -> текст
...
Реализация может быть на любом кросспатформенном языке программирования.
Интересна скорость реализаци на том или ином языке программирования. Можно использовать сторонние библиотеки.

file -> текст
это текст в файле с именем file.

p.s. вложенность может быть любой, от Б до БN, потому не привязывайтесь к директориям с 3 уровнем вложенности.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Iron Bug
  опции профиля:
сообщение 26.9.2010, 21:44
Сообщение #2


Профессионал
*****

Группа: Модератор
Сообщений: 1611
Регистрация: 6.2.2009
Из: Yekaterinburg
Пользователь №: 533

Спасибо сказали: 219 раз(а)




Репутация:   12  


уточни задачу:
встречаются ли в "тексте" выражения типа А0..0, Б0..0, ...? какие лексемы там могут быть?
что служит разделителем записей?

я бы сделала подобную ***** на ANTLR. там очень просто сгенерить такой парсер. но насчёт скорости её работы - не знаю.
Причина редактирования: давайте общаться без мата
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
kwisp
  опции профиля:
сообщение 26.9.2010, 22:36
Сообщение #3


астарожна ынтжинэр
*****

Группа: Участник
Сообщений: 1404
Регистрация: 26.11.2008
Из: ТаганрогРодинаЧехова
Пользователь №: 435

Спасибо сказали: 113 раз(а)




Репутация:   23  


так на вскидку С++ stl и всё.
ну платформозависимо создавать дирректорию.
если чесно не пойму в чем интерес? - сравнить скорость результата на разных языках?
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
igor_bogomolov
  опции профиля:
сообщение 27.9.2010, 9:36
Сообщение #4


Профессионал
*****

Группа: Сомодератор
Сообщений: 1215
Регистрация: 22.3.2009
Из: Саратов
Пользователь №: 630

Спасибо сказали: 235 раз(а)




Репутация:   29  


Можно написать на ruby
Раскрывающийся текст
#!/bin/ruby
# -*- coding: utf-8 -*-
require 'fileutils'
require 'optparse'
require 'ostruct'

#параметры по умолчанию. Можно менять через параметры запуска. Справка вызывается стандартно --help
options = OpenStruct.new
options.file = "file.txt"
options.path = "/tmp/test_ruby/out"

OptionParser.new do |opts|
  opts.banner = "Usage: parser.rb [options]"
  opts.on("-f", "--file FILE", String, "path to file") do |t|
    options.file = t
  end
  opts.on("-p", "--path DIR", String, "path to output dir") do |t|
    options.path = t
  end
end.parse!

def parseFile(file, path)
  f = File.open(file)
  f.each do |line|
    dir, text = line.split(/\s+/)
    next if dir.nil? or dir.empty?
    
    fullPath = path + dir.gsub(//, '/')    
    FileUtils.makedirs(fullPath)
    
    outFile = File.open(fullPath+"file", "w")
    outFile.puts text
    outFile.close                    
  end
  f.close
end

parseFile(options.file, options.path)
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
molchanoviv
  опции профиля:
сообщение 27.9.2010, 18:21
Сообщение #5


Старейший участник
****

Группа: Сомодератор
Сообщений: 597
Регистрация: 18.7.2008
Из: Саратов
Пользователь №: 238

Спасибо сказали: 41 раз(а)




Репутация:   5  


на перле гоняем цикл для прохода по строкам и регэкспом разделения строки на состовляющие.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
ViGOur
  опции профиля:
сообщение 27.9.2010, 19:37
Сообщение #6


Мастер
******

Группа: Модератор
Сообщений: 3296
Регистрация: 9.10.2007
Из: Москва
Пользователь №: 4

Спасибо сказали: 231 раз(а)




Репутация:   40  


Имеется ввиду не скорость работы, а скорость разработки... :)
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Алексей1153
  опции профиля:
сообщение 27.9.2010, 21:09
Сообщение #7


фрилансер
******

Группа: Участник
Сообщений: 2941
Регистрация: 19.6.2010
Из: Обливион
Пользователь №: 1822

Спасибо сказали: 215 раз(а)




Репутация:   34  


С++ и STL
где-то 15 минут на написание, 5 минут на отладку, 5 минут на оформление поста ))

Раскрывающийся текст
#include <map>
#include <algorithm>
#include <string>

void split(const char* pFile,const DWORD dwdFileLen)
{
    const char* pCurr=pFile;
    const char* pCurrEnd=pFile+dwdFileLen;

    const char Sep[]="\r\n";
    const char* pNext=0;
    std::string currpath;

    //1:путь , 2: текст файла
    typedef std::map<std::string,std::string> td_dirslist;
    td_dirslist _dirslist;

    for(;pCurr<pCurrEnd;pCurr++)
    {

        pNext=std::find_first_of(pCurr,pCurrEnd,Sep,Sep+sizeof(Sep)-1);
        
        currpath="./";
        for(;pCurr<pNext;pCurr++)
        {
            if(*pCurr=='\r' || *pCurr=='\n')break;

            if(*pCurr==' ')
            {
                _dirslist[currpath]=std::string(pCurr+1,pNext);
                break;
            }

            currpath+=*pCurr;
            currpath+="/";
        }

        pCurr=pNext;
        while(pCurr<pCurrEnd && (*pCurr=='\r' || *pCurr=='\n'))
        {
            pCurr++;
        }
        pCurr--;
    }

    //сохранение
    td_dirslist::iterator it=_dirslist.begin();
    for(;it!=_dirslist.end();it++)
    {
        //создать каталог it->first
        //...

        //создать там файл file.txt с содержимым it->second
        //...
    }

}


вызов
Раскрывающийся текст
const char* txt=
    "А текст1\r\n"
    "А0 текст2\r\n"
    "А1 текст3\r\n"
    "\r\n"
    "А00 текст4\r\n"
    "А01 текст5\r\n"
    "\r\n"
    "А000 текст6\r\n"
    "А001 текст7\r\n"
    "\r\n"
    "Б текст8\r\n"
    "Б0 текст9\r\n"
    "\r\n"
    "Б00 текстA\r\n"
    "\r\n"
    "Б000 текстB\r\n"
;

split(txt,strlen(txt)-1);


результат в мапе
Раскрывающийся текст
_dirslist ==
[0]    ("./А/","текст1")    
[1]    ("./А/0/","текст2")    
[2]    ("./А/0/0/","текст4")    
[3]    ("./А/0/0/0/","текст6")    
[4]    ("./А/0/0/1/","текст7")    
[5]    ("./А/0/1/","текст5")    
[6]    ("./А/1/","текст3")    
[7]    ("./Б/","текст8")    
[8]    ("./Б/0/","текст9")    
[9]    ("./Б/0/0/","текстA")    
[10]    ("./Б/0/0/0/","текстB")


Сообщение отредактировал Алексей1153 - 27.9.2010, 21:10
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
kwisp
  опции профиля:
сообщение 28.9.2010, 13:51
Сообщение #8


астарожна ынтжинэр
*****

Группа: Участник
Сообщений: 1404
Регистрация: 26.11.2008
Из: ТаганрогРодинаЧехова
Пользователь №: 435

Спасибо сказали: 113 раз(а)




Репутация:   23  


ViGOur,
требуются уточнения:
1. может ли быть последовательность в "перемешку" ?
Цитата
А1 текст
А текст
А001 текст
А00 текст

2. я так понимаю директории самому создавать надо?
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
kwisp
  опции профиля:
сообщение 28.9.2010, 17:50
Сообщение #9


астарожна ынтжинэр
*****

Группа: Участник
Сообщений: 1404
Регистрация: 26.11.2008
Из: ТаганрогРодинаЧехова
Пользователь №: 435

Спасибо сказали: 113 раз(а)




Репутация:   23  


Раскрывающийся текст

# include <vector>
# include <string>
# include <algorithm>
# include <iostream>
# include <fstream>
# include <iterator>

typedef std::vector<char> chContainer;
typedef std::vector<char>::iterator chContainerIter;
typedef std::vector<char>::const_iterator chContainerConstIter;

void SSParser(const char* filename)
{
std::ifstream file(filename);
std::istreambuf_iterator<char> first(file.rdbuf());
std::istreambuf_iterator<char> eos;
chContainer chArray(first,eos);
std::string dir("");
const char space = ' ';
const char caret = '\n';

chContainerIter endChArray = chArray.end();
chContainerIter newBegin = chArray.begin();

chContainerIter spaceIter = std::find(newBegin, endChArray, space);
chContainerIter endlIter = std::find(newBegin, endChArray, caret);

while (spaceIter != endChArray) {
  dir.assign(newBegin,spaceIter);
  // создание директории dir ....
  newBegin =  endlIter+1;
  std::ofstream ofile(...); // файл в только что созданной дирректории
  std::copy(spaceIter+1,endlIter, ostreambuf_iterator(ofile));
  spaceIter = std::find(newBegin,endChArray, space);
  endlIter = std::find(newBegin,endChArray, caret);
}
}


вот. без проверок корректности файла, с учетом последовательности А...N указанной в первом посте. ну и не знаю как кроссплатформенно создать директорию.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
ViGOur
  опции профиля:
сообщение 28.9.2010, 19:14
Сообщение #10


Мастер
******

Группа: Модератор
Сообщений: 3296
Регистрация: 9.10.2007
Из: Москва
Пользователь №: 4

Спасибо сказали: 231 раз(а)




Репутация:   40  


Цитата(kwisp @ 28.9.2010, 14:51) *
ViGOur,
требуются уточнения:
1. может ли быть последовательность в "перемешку" ?
Нуууу, если для усложнения задачи, то можно и так. А так в принципе всеравно.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение

2 страниц V   1 2 >
Ответить в данную темуНачать новую тему
Теги
Нет тегов для показа


1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0




RSS Текстовая версия Сейчас: 23.12.2024, 2:03