Отправляет email-рассылки с помощью сервиса Sendsay

[Max Reader] корректор текста - текстовик

здравствуйте рассылка.
поюзал эту программу - текстовик и могу сказать следующее:
очень все здорово там работает. и самое главное вроде без глюков. рекомендую
ее всем.
если прогнать текст через - умное форматирование, то получится результат такой
же как в stcfmr.
тоесть на одной строке могут оказаться даже два предложения, но они не будут
разбиваться строкой. что после обработки можно смело использовать в программе
- макс ридер.
особо хотелось бы узнать мнение Валерия Антоненкова. так как текстовик не убирает
многие символы. будет ли это влиять на стабильность работы словаря произношений,
который самой последней версии?

Ответить   Tue, 11 Aug 2009 17:47:51 +0300 (#893793)

 

Ответы:

Всем, здравствуйте.

Корректор Textovik джозится, конечно, на 100%, но то, что несколько
предложений после умного форматирования получаются на одной строке
является, по-моему, недостатком, потому, как могут получаться длинные
строки и макс-ридер предлагает текст переформатировать, после чего
предложение может оказаться опять разбитым на две строки.
но может быть я ошибаюсь.

Ответить   Tue, 11 Aug 2009 21:17:29 +0600 (#893806)

 

здравствуйте Mikhail .
вы пишете:

но то, что несколько

-- в этом случае нужно обязательно отказаться от переформатирования который
предложит макс ридер.
суть именно в том и заклюючается, что авторы программы максридер несколько
облажались с этим , вообщем самым основным моментом.
дело в том что при разбитии предложения строкой, можно навсегда попрощаться
с максимальной производительностью словаря ударений.
так как может возникнуть ситуация, когда какое нибудь словосочетание будет
разделено разными строками и соответственно не будет обработано правильно
статьей из словаря произношений.
как я и наверное многие увидели , что максридер справляется сс не очень
длинными строками.
у меня было предложение из несколько тысяч символов. что то за 1000.
и это предложение в целях эксперимента занимало одну строку. и макс это дело
нормально обработал.
а вообще авторы такой сложной программы, могли бы все это предусмотреть.
вообще если знать как это сделать, то по правилам современных операционных
систем возможно обрабатывать строки до 2 гигабайт.
и до 1 гигабайт двубайтовые символы, если я не ошибаюсь. я думаю что многим
бы захотелось слушать книги по принципу - нажал одну кнопку и слушай.
я и сам почти надеюсь, что может вдруг - однажды выйдет новый макс ридер с
большими усовершенствованиями. тогда соответственно не придется говорить о
длинных или не очень длинных строках.

Ответить   Tue, 11 Aug 2009 19:58:26 +0300 (#893840)

 

Всем, здравствуйте.

с

о

Я жду, когда Александр и Максим вновь вернуться к усовершенствованию
макс-ридера и снимут проблему загрузки большого словаря.
Я думаю, что было бы совсем неплохо, если бы обработка текста
осуществлялась с использованием нескольких словарей. Не в смысле
разных авторов, а разных по назначению: один бы словарь обрабатывал
слова, в которых ударение ставится однозначно. Другой бы словарь
обрабатывал слова с плавающим ударением, анализируя контекст, третий
обрабатывал бы произношение дат и прочих числовых значений.
Если макс-ридер будет без проблем загружать сколь угодно большие
словари, не будет необходимости обсасывать каждое слово для включения
его в словарь, а можно будет вставлять слова полностью. Тогда можно
будет брать за основу любой литературный словарь ударений.

Ответить   Wed, 12 Aug 2009 08:24:44 +0600 (#893913)

 

здравствуйте Mikhail .
вы пишете:
обработка текста

--
сразу извиняюсь за излишние цитирование.
вообщем лично я согласен со всеми пунктами.
но пока такой лафы нету. далее выскажу свои мысли по еще одному варианту:
сейчас как раз пытаюсь ввести в stcfmr словарь предкоррекции ударений,
используя словарь максридера.
правда этим всем делом будет возможно не очень удобно пользоваться, но зато
избавит от ограничения словаря по его размеру в байтах.
незнаю насколько у меня в целом это получится, но думаю что должно хоть что
нибудь получиться.
идея такая:
допустим у макса еще пустой словарь. например я пользуюсь максом и
прослушиваю книги непосредствнно на компьютере.
когда в тексте встречается неправильное произношение в сочетании слов или в
отдельном слове, я заношу это дело в словарь произношений. когда я прослушаю
книгу, я закрываю макс и запускаю корректор строк.
там нужно будет ввести кнопку - импортировать. но вначале будет все делаться
вручную, так как сортировать словарь автоматически это несколько позже.
ну допустим там эта кнопка уже есть. нажав на кнопку, откроется проводник с
диалогом выбора пути к файлу словаря , который использует максридер -
dictionary.txt.
после нажатия на кнопку открыть - этот файл импортируется в собственный
словарь корректора строк. при импортировании произойдет автоматическая
сортировка статей от большей к меньшей.
после чего можно выбрать в корректоре строк следующую книгу которую допустим
я хочу прочитать.
выбрав книгу и нажав кнопку - начать произойдет коррекция строк с коррекцией
ударений из уже собственного словаря.
при импорте файл словаря максридера будет уничтожен. после чего обработанный
текст загружается в макс. теперь в самом тексте проставлены ударения. и на
этих словах макс уже не делает ошибок. а другие слова с неправильным
произношением опять заносятся в словарь макса.
таким образом при следующем импортировании новые статьи словаря макса будут
добавлены к уже имеющимся в корректоре. после чего файл словаря макса будет
опять пустым.
конечно это неудобно. но другой альтернативы я не придумал.

Ответить   Wed, 12 Aug 2009 10:55:59 +0300 (#894048)

 

здравствуйте, Игорь. по-моему замечательная идея, только может надо что-бы в
корректоре изначально был уже какой-нибудь словарь, например тот который создал
Валерий. и хорошо-бы сразу автоматизировать процесс, потому что не уверен что
конечный пользователь сможет разобратся с ручной сортировкой, и ему будет охота
ей заниматся.
с уважением Николай.
icq 275023320
skype lapsus3500

Ответить   Wed, 12 Aug 2009 13:49:36 +0400 (#894052)

 

здравствуйте Николай.
вы обсолютно правы. я просто забыл.
вообщем так:
при первом запуске корректора - ветвление проверит наличие словаря в рабочей
директории stc_work.
так как его изначально небудет, то будет произведено копирование из папки с
программой в папку stc work - базового словаря Валерия Антоненкова.
и конечно это будет сделано автоматически. потом уже скопированный базовый
словарь можно будет наращивать как я писал в предыдущем письме.
но а автосортировка - это мне надо еще хорошо подумать. вообщем как это на
блок схеме я понимаю. но функция которая избавляет от рутинных операций, не
была мной еще ниразу испробована.
еще хочу сказать по поводу словаря от Валерия:
прослушал пару книг Стивена Кинга и скажу что очень даже круто получается
результат произношений!
еще наверное статей так в 100 килобайт , и данный сверх продуманный словарь
наверное справится с любыми не сильно замороченными текстами.

Ответить   Wed, 12 Aug 2009 13:24:03 +0300 (#894068)

 

Здравствуйте друзья!
Игорь пишет:>

результат произношений!

Боюсь что объем в данном варианте подходит к концу, и о 100 килобайтах вряд
ли придется мечтать!
И как говорит алексей Северин, пора продумывать на программном уровне.
Вот мне понравилась идея нескольких словарей по типу словарных статей, и в
этом могли бы помочь Васильевы, в программе есть внутренние словари, я
толком в них неразобрался , вернее как их дополнять, а подсказать как это
делается , Васильевы проигнорировали,
А вот в них неплохо бы забацать,большой словарьимен, фамилейну и всякого
рода слов с однозначным ударением, особо я имею ввиду это имена и фамилии,их
такое большое количество, что внешний словарь с которым я занимаюсь просто
задохнется, и как язамечаю словарные статьи все чаще вступают в конфликт.
Поэтому я и стараюсь как можно меньше их туда включать, и если длинные
воспринимаются неплохо, то короткие весьма неприятны.
В словарных статьях символ пробел, играет немаловажную роль, но
возрастание словарных статей приводит к тому что нахождение в предложениях
рядом двух и более слов из словаря учащается, а это значит, что пробел может
относиться ка корекции первого, так и второго слова.
Вот вам и конфликт, и тут либо оставлять одно из них либо прописывать новую
статью, из этих слов, но теперь уже это будет контекст, и его необходимо
поднимать выше, так чтобы синтезатор к этому сочетанию обратился ранее.
Ну и так далее.
Вот поэтому, как мне кажеться отдельные слова, из этого словаря надо
перемещать во внутренние, где как я понимаю, символ пробел, в коррекции
неучаствует.
Так что я с грустью должен признать что тот труд над словарем который я
провел, к тому результату о котором я мечтал, непривел.
Кустарщина она и есть кустарщина!
А вот Отговорка что , Максим теперь не студент , а Занятой человек,
это както неубедительно!
"Мы в ответственности за тех, кого приручили!"
И уж если работа начата то надо бы доводить до максимума возможного
качества, или передать тем кто эту доводку сможит сделать, и программа, из
за того что ее будут доробатывать другие все равно останется"Max-Reader",
И заслуга первичных разработчиков от этого нисколько не приуменьшится, ведь
чтобы ниговорили, а ведь несмотря на обилие других , эта остается для
незрячих наиболее удобной и универсальной!

С уважением, Валерий Антоненков.

Ответить   Wed, 12 Aug 2009 20:23:10 +0400 (#894219)

 

здравствуйте Валерий.
вы пишете:

--
может оно действительно и так, но...
это абсурд!!
логически так не может быть!!
когда вставляется подготовленная статья во вхождение найденной в
предложении - тот кусок родного текста удаляется, а подготовленная статья
вставляется. при этом текст как бы раздвигается в стороны. это чтоб понятней
было.
а еще моя логика говорит что каждая уже вставленная строка должна
помечаться.
например после каждой буквы должно проставляться подчеркивание. это для того
чтобы если - это слово имеет с ближайшим контекст, а в словаре при этом
встретится отдельное слово, то произойдет ошибочная замена очередного слова,
так как отдельное слово будет стоять ниже слова в контексте в словаре
произношений.
короче я отвлекся. так вот когда вставляется подготовленная статья она так и
вставляется со всеми пробелами как и было прописано в словаре произношений.
при этом между словами по краям этой вставленной строки может оказаться и
два пробела. что все равно не должно влиять на работу корректного
замещения.

Ответить   Wed, 12 Aug 2009 21:06:25 +0300 (#894249)

 

Всем, здравствуйте.

После коррекции текста словарь работает, конечно, эффективнее.
Насколько будет удобнее совмещение коррекции текста и расстановки
ударений не знаю.
Как долго это будет по времени?
Если дольше, чем загрузка макс-ридера с большим словарём, то
насколько это будет удобнее трудно сказать.
Пока для меня оптимальным является настоящая ситуация: быстрая Коррекция в
нынешнем виде и словарь 170КБ.
С этим словарём макс-ридер у меня грузится примерно 13 секунд.
Если словарь подрастёт до 300КБ грузится будет примерно 30 секунд. Это
вполне удовлетворительно.
Но зато после загрузки я могу сколь угодно перебирать книг для отбора
с достаточно качественным предварительным просмотром.
Если словарь макс-ридера отсутствует, то понятно эта процедура будет
не очень устраивать. потому как предварительно надо расставить
ударения. А отбор книг тоже важный момент, потому как по названию
книги трудно сказать стоит ли её читать, надо немного послушать, а это
тоже неплохо бы с качеством чтения.

Ответить   Thu, 13 Aug 2009 12:44:55 +0600 (#894400)

 

здравствуйте Mikhail .
вы пишете:

--
я и не говорил что это будет удобнее. я вот думаю что не будет удобно, но
весь смысл этой байды в том, чтобы в итоге можно было бы использовать
большой словарь произношений.
так как макс просто сдыхает при еще небольших объемах.
обрабатываться конечно это байда будет медленнее чем загрузка макса с его
словарем. примерно столько же времени когда в максе конвертят текст в mp3.
может даже быстрее. вообщем опыт покажет.
но а словарь все же в этом альтернативном варианте удалять нужно. так как
могут возникнуть ошибки при послушивании книги в максе после коррекции
ударений в корректоре строк.
просто многие обработанные слова с контекстом будут искажены по
произношению. так как макс решит заменить ударение в отдельном слове когда
оно встретится в словаре произношений. так как уже исправленное слово после
корректора строк уже будет изменено на один знак. этот знак и будет знаком -
< , тоесть ударением на слог.
вот потому такие неудобства и получаются.
вообщем как бы там ни было, все равно всем не угодишь.
такого просто не бывает. но все же почему бы не сделать альтернативный
вариант, по сглаживанию все пока еще одной и той же проблемы.

Ответить   Thu, 13 Aug 2009 11:41:42 +0300 (#894443)

 

привет коллеги! мы все приходим к одинаковым выводам, что расширять
dictionary далее не стоит, и требовать что-то от авторов max-reader не
корректно, хотя бы потому что у нас гарантированный кусок хлеба с маслом.
посылать куда-то деньги вряд-ли стоит, не в этом причина мне кажется. а вот
покопаться в папке bin или в файле dictor?
что одно и тоже специалистам, а ещё может в digalo russian там если искомое
находиться? заметьте я только рассуждаю, и ни в коем случае не претендую на
истину. с уважением Шихам.

Ответить   Thu, 13 Aug 2009 11:26:05 +0400 (#894452)

 

привет коллеги!я тоже посмотрел справку текстовика, и подумал вот о чём:если
большинство читателей такие-же ленивые как я, то может какую-то функцию из
него которой нет в корректоре строк в оный добавить, и будет хорошо.
ну не лежит душа прогонять текст по три раза, чтобы раз прочесть, и забыть.
или чего-то я не досмотрел в текстовике? с уважением Шихам.

Ответить   Tue, 11 Aug 2009 20:33:13 +0400 (#893838)

 

Здравствуйте, Шихам.

Вы писали 11 августа 2009 г., Время - 22:33:

По-моему три раза прогонять не обязательно, а воспользоваться умным
форматированием.
Программка, безусловно, хорошая, потому как даёт возможность удобного
чтения зрячему брату и с экрана.
Крометого, здесь же в редакторе можно подредактировать текст:
заголовки, названия глав и разделов, когда они без точек и прочее,
есть переход к строке по номеру.
Можно, однако, и менять кодировки.
Одним словом, ещё один неплохой редактор.
Я долгое время корректировал текст текстовиком для говорилки.

Ответить   Wed, 12 Aug 2009 08:06:48 +0600 (#893909)

 

привет коллеги! общаясь с Сашей Васильевым, и задавая ему теже вопросы, что
возникают здесь, повторю его мысль:Максим уже не студент, и работа отнимает
достаточно много времени для усовершенствования max-reader. может поэтому
стоит работать над программами типа корректора строк. что касается словаря
dictionaey, то выскажу своё мнение, до бесконечности раздувать его не
продуктивно, по причинам которые вы сами прекрасно знаете. а вот встроить
словарь в саму программу,
чтобы он не мешал это было бы замечательно. можно скооперироваться с
авторами, и предложить какую-то готовую схему. конечно мои делитантские
рассуждения могут не подойти, но отдадим себе отчёт, что новой версии
max-reader пока ждать не приходиться.с уважением Шихам.

Ответить   Wed, 12 Aug 2009 09:48:07 +0400 (#894059)

 

Здравствуйте, Шихам!

12.08.2009

Давайте кооперироваться кому денежки посылать будем чтобы
заинтересовать разработчиков этого проекта и чтобы васильевы сделали
как делает сергей волков нормальный проект? Я согласен выслать 100
руб россии!Давайте адрес и копите деньги и вперед!

Ответить   Wed, 12 Aug 2009 21:18:18 +0300 (#894267)

 

Здравствуйте все и Игорь!
Программа заинтересовала, но сразу нескачал, а теперь ненайду ссылку.
Игорек, пришли и заодно и третий я несмог скачатьего .

А замена многоточия присутствует?
как дело с пробелами, кавычки, решетка, и т.д.
как переносы по слогам?
Словосочитания через дефис, сокрощения.
Я их уже подстроил в последней редакции под твой корректор.
Вобщем пиши, почти все разгреб, осталось несколько неотвеченных, но они
требуют осмысления.
С уважением, Валерий Антоненков. >

Ответить   Wed, 12 Aug 2009 03:07:42 +0400 (#893892)

 

здравствуйте Валерий.
вы пишете:>

--
ну, да.
многоточия скорей всего не удаляются. всякие решетки и прочий визуальный
хлам - тоже нет.
сокращения будут на одной строке - что правильно .
пробелы убираются как в самой строке , так и по ее краям. только какого
черта вначале строки ,удаляются по одному пробелу - я так и не понял.
а вот со знаками переносов действительно не получилось.
зато он хорошо форматирует строки, как я писал ранее. конечно если знать
можно и word науськать делать все что угодно, написав макрос.
в нем вообще можно сделать с текстом что только мозги смогут сочинить. в
максе так тоже можно было бы сделать при форматировании текста. все равно он
по умолчанию использует word.
я чего про словарь спрашивал:
ведь макс все равно не читает все эти символы, если их конечно не прописать
в словаре произношений.
я понял что эти символы могут давать сбой при использовании Николая. но все
равно не догоняю почему, так может быть.
потому я и спрашивал про словарь произношений последней версии. может сейчас
он будет стабильно работать несмотря на , то что в тексте есть всякие
квадратные скобки и страшные маркеры с тильдами?
я вообще думаю что если сбой и происходит, то и не всегда из за словаря.у
меня такой сбой был вообще с пустым словарем.

Ответить   Wed, 12 Aug 2009 10:15:27 +0300 (#893983)