Идеи. Инициативы. Предложения, (по поводу деятельности проекта) |
Здравствуйте, гость ( Вход | Регистрация )
Идеи. Инициативы. Предложения, (по поводу деятельности проекта) |
22.3.2011, 14:01
Сообщение
#1
|
|
Активный участник Группа: Актив Сообщений: 1561 Регистрация: 12.4.2010 Пользователь №: 1766 |
Идеи. Инициативы. Предложения
(по поводу деятельности проекта) |
|
|
6.4.2011, 18:07
Сообщение
#2
|
|
Активный участник Группа: Актив Сообщений: 1561 Регистрация: 12.4.2010 Пользователь №: 1766 |
Цитата Ребята, у меня есть все учебники советской школы практически по всем предметам и по всем классам. + 4-х томник "История русской литературы" 1983 г., + 4-х томник "История русской советской литературы" 1971 г. + 12 томник произведений о Великой Отечественной войне и т.п. и т.д. Отсканировать и распознать можно все. Главное, нужен план - что делать и как делать. Что делать и как делать... Соло, если бы Вы эту работу сделали по сканированию, то было бы хорошо. Единственное, что те сканы, которые я видел (Вы их пересылали Памиру), вызывают к жизни несколько советов, которые хорошо бы учесть прежде, чем двигаться дальше: 1. Сканы получились чересчур темные. Как я понял, их будут теперь осветлять. Но чтобы не приходилось осветлять в каждом конкретном случае, Вам необходимо настройки сканера сбросить на "дефолт" (должна быть такая функция, автоконтраст, авто-режим). 2. Сканы также будут подрезать. Не знаю, можно ли что посоветовать, чтобы не пришлось подрезать их в следующий раз. (Огромное количество сканов подрезать - довольно рутинная работа). 3. Чтобы правильно все оформлять при сканировании, нужно каждому скану давать номер сообразно номеру странички учебника (или книги). Если я где не прав, то специалисты меня поправят. Кроме того, все сканы надо собирать в одну папку. Не надо для каждого скана делать свою папку. Потом время тратится на достование их ооттуда и уровень рутинной работы увеличивается. Вот такие технические советы всем сканирующим учебники и книги. В перспективе эти советы всем нам облегчат жизнь. Сканировать может один человек (или группа человек, у нас же сейчас уже есть кружки по стране), а распознавать и собирать в документ - другая. Нужно токмо правильно соорганизоваться. Цитата Ребята, у меня есть все учебники советской школы практически по всем предметам и по всем классам. + 4-х томник "История русской литературы" 1983 г., + 4-х томник "История русской советской литературы" 1971 г. Шикарная библиотека, на самом деле! Очень шикарная! Интернеты таким явно не богаты.+ 12 томник произведений о Великой Отечественной войне и т.п. и т.д. Если бы мы сделали это достояние представленным на Совшколе, было бы великолепно. |
|
|
7.4.2011, 7:52
Сообщение
#3
|
|
Активный участник Группа: Пользователи Сообщений: 1249 Регистрация: 23.10.2010 Из: Краснодарский край Пользователь №: 2091 |
Соло, если бы Вы эту работу сделали по сканированию, то было бы хорошо. Единственное, что те сканы, которые я видел (Вы их пересылали Памиру), вызывают к жизни несколько советов, которые хорошо бы учесть прежде, чем двигаться дальше: ... Док, простите, но я все же думаю, что имеет смысл мне не просто сканировать, но и сразу распознавать текст. Я все равно при сканировании использую программу ABBYY FineReader. Тогда я сама могу пересканировать сраницу столько раз и с таким качеством, которое будет лучше при распознавании. То сканирование учебника было, можно сказать, первым блином. Там серьезная организация текста - и вставленные в текст картинки, и сложное расположение, и куча колонтитулов на каждой странице. Поэтому мне важнее было бы понять как оптимальнее в таких случаях следует сканировать и распознавать: может имело бы больший смысл разпознавать текст отдельно, а картинки - отдельно, раскладывать их в разные файлы, поименованые номером одной и той же страницы учебника, а потом, соединять при выкладывании на сайт? И т.д. Опять же важен формат, в котором потом распознается текст. Насколько я поняла, проще и быстрее сделать в рдф. Темными сканы могли получиться потому, что учебник все же старый, и сами страницы не такие светлые. Ясно, что это регулируется установками программы. Но об этом можно было сказать и я бы пересканировала. Я писала об этом Памиру. И говорила, что если что не так - я переделаю. И примеры сканов страниц посылала. Потом, многие из тех книг, что у меня есть, это вообще просто текст, причем эти книги в хорошем состоянии со светлимы страницами. Т.е. распознавать будет очень просто. Какой смысл делать только сканы, когда можно сразу сделать дос. или рдф.? Опять же какие книги делать сначала, ибо их у меня очень много. Я назвала не все. Есть практические еще весь Перельман (Занимательные ....) Есть огромное количество советской литературы в ПСС, причем много детской литературы: от Детской всемирки в 58 томах до Библиотеки пионера в 12 т. Есть много учебников по физике и математике, начиная со школьного курса спецшкол до курса университета. Много научно-популярной литературы - серия брошюр "Знание" и т.д. Сообщение отредактировал Соло - 7.4.2011, 8:07 |
|
|
Текстовая версия | Сейчас: 1.11.2024, 2:10 |