رسته‌ها
راهنمای تهیه کتاب الکترونیکی
امتیاز دهید
5 / 4.6
با 59 رای
امتیاز دهید
5 / 4.6
با 59 رای
.

این کتابچه، به نحوه اسکن بهینه و استفاده از نرم افزار ScanKromsatorجهت تهیه کتاب الکترونیکی به فرمت pdf می پردازد.
بیشتر
اطلاعات نسخه الکترونیکی
تعداد صفحات:
34
فرمت:
PDF
آپلود شده توسط:
sagaliga
sagaliga
1392/04/11

کتاب‌های مرتبط

درج دیدگاه مختص اعضا است! برای ورود به حساب خود اینجا و برای عضویت اینجا کلیک کنید.

دیدگاه‌های کتاب الکترونیکی راهنمای تهیه کتاب الکترونیکی

تعداد دیدگاه‌ها:
109
[quote='sagaliga']نقل قول از Bronowski:...در مورد OCR هیچکدام از برنامه های موجود، برای زبان فارسی عملکرد خوبی ندارند، اما Google Drive در این زمینه یک استثناست...
از لحاظ دقت تشخیص کاراکترها بی نظیره. اما من به یک مشکل عجیب برخوردم. OCR گوگل درایو بعد از هر پنج یا شش خط را که پردازش می کند، یک خط را به طور کامل حذف می کند! برای شما هم پیش آمده؟ ضمناً قادر به تشخیص شروع پاراگراف جدید نیست و همۀ نوشته ها را پشت سر هم میاورد. بسیاری از نیم فاصله ها را هم رعایت نمی کند؟ دوستان تجربه شما چطور بود؟[/quote]
درود بر حمید گرامی
بستگی به کیفیت فایل اسکن شده داره و همچنین ساعات پرترافیک گوگل درایو. معمولا در ساعاتی که ترافیک بالاست، اصلا فایلی Text نمی کنه. برای صفحه های با حجم لغتی زیاد هم در بعضی موارد کلمه یا جمله ای جا می افته. OCR گوگل درایو با حروف "ک" "گ" "ژ" مشکل داره و دو مورد اول را به "ا" تبدیل می کنه، البته نه همیشه.
در کل ویرایش انسانی بر روی خروجی این برنامه و هرگونه خروجی برنامه مشابه، ضروریه. سرعت تایپ یه کتاب با استفاده از این قابلیت Google Drive، بسته به اینکه موارد مربوط به استاندارد فایل ورودی به درستی رعایت و اعمال شوند، بین 10 تا 20 برابر افزایش پیدا می کنه.
[quote='Bronowski']...در مورد OCR هیچکدام از برنامه های موجود، برای زبان فارسی عملکرد خوبی ندارند، اما Google Drive در این زمینه یک استثناست...[/quote]
از لحاظ دقت تشخیص کاراکترها بی نظیره. اما من به یک مشکل عجیب برخوردم. OCR گوگل درایو بعد از هر پنج یا شش خط را که پردازش می کند، یک خط را به طور کامل حذف می کند! برای شما هم پیش آمده؟ ضمناً قادر به تشخیص شروع پاراگراف جدید نیست و همۀ نوشته ها را پشت سر هم میاورد. بسیاری از نیم فاصله ها را هم رعایت نمی کند؟ دوستان تجربه شما چطور بود؟
کتاب ده روز با داعش، نویسنده خبرنگار آلمانی یورگن تودنهوفر، ترجمه علی عبداللهی،زهرا معین الدینی، چاپ اول پائیز 94 ،(قطع رقعی، تعداد صفحات 330 صفحه، قیمت 20 هزارتومان)یعنی دقیقا در اوج درگیری های بنیادگرایان و جهادیون داعش در منطقه، آنهم در زمانی که روز و هفته ای نبود که اخبار سربریدن و آتش زدن و به بردگی و کنیزی گرفتن زنان ایزدی در رسانه های جمعی جهان و ایران منتشر نگردد، این کتاب در واقع خبر دسته اولی بود که خبرنگار و نویسنده کتاب خود شخصا در منطقه تحت تسلط خلافت اسلامی(داعش) حضور داشته،پس چنین کتابی در این شرایط میتونه بسیار پرفروش باشه ولی جای تعجبه وقتی به تیراژ چاپ کتاب نگاه میکنی می بینی تنها هزار نسخه از این کتاب چاپ گردیده! این تعداد کتاب برای کشوری با 80 میلیون جمعیت! آیا واقعا وضعیت مطالعه در کشور تابدین حد اسفبار شده که تنها هزار نسخه از این کتاب چاپ و منتشر می گردد آنهم در زمانی که تنها در تهران 1200 واحد کتابفروشی وجود دارد؟! نتیجه گیری رو به عهده خود شما میگذارم، برای درک بهتر این موضوع فقط کافیست بگوییم کتابفروشی که من این کتاب رو از آن تهیه نمودم خود اعتراف نمود که لااقل 100 نسخه از این کتاب رو خود ظرف مدت یکی دو ماه فروخته بود!
مثال دیگر برای بهتر روشن شدن این موضوع اینکه برای مثال کتابهای معروف اولوین تافلر، شوک آینده یا کتاب موج سوم اگر درست بخاطر داشته باشم ترجمه و چاپ اول آن در ایران سال 72 بود، این کتاب در چاپ اول 10 هزار نسخه چاپ گردید! دو سه ماه بعد حدود 20 هزار نسخه! یکی دوماه بعد10 هزار نسخه و به همین ترتیب، وقتی حساب کردم دیدم در ظرف یکسال حدود 50 هزار نسخه از این کتاب چاپ و منتشر گردیده. در سال 72 جمعیت ایران حدود 65 میلیون نفر بوده،آیا آمار سرانه مطالعه در این سال تابدین حد بیشتر از زمان حال بوده که یک کتاب با این تیراژ چاپ و منتشر می گردد؟ مطمئنا آمار مطالعه در 25 سال پیش بیار بیشتر از زمان حال بوده ولی به نسبت جمعیت و این تیراژ چاپ یک کتاب و مقایسه با زمان حال و افزایش جمعیت بعید به نظر میرسد که تنها دلیل پایین بودن تیراژ چاپ کتاب بوده باشد.(اکثر کتابها تیراژ چاپ آنها از 800 نسخه تا نهایت 2 هزار نسخه می باشد!)
در دهه های گذشته چیزی به نام مرکز پخش وجود نداشت،انتشارات کتاب رو پس از چاپ مستقیم به دست کتابفروش می رساند و کتابفروشی نیز یک سود مشخص آن را به مشتری می فروخت،ولی زمان حال با این وضعیت چاپ و نشر کتاب شاهدیم که ده ها مرکز پخش(واسطه،دلال) وجود دارد که میان انتشارات و خریدار قرار گرفته و به نوعی سهم دلالی خود را از هر نسخه کتاب بدست می آورند و نتیجتا یک کتابی 300 صفحه(قطع رقعی با جلد شومیز) که سه دهه پیش 1000تا1500 تومان قیمت داشت اکنون باید با کیفیت پایین تر با قیمت بالای 15 تا 20 هزارتومان خریداری گردد! آیا دلیل افزایش قیمت در صنعت چاپ تنها به تورم و بالا رفتن قیمت ارز بستگی داشته یا عوامل دیگری نیز در این موضوع دخیل بوده است؟!
جناب sagaliga گرامی همینگونه است که میفرمایید، متاسفانه به دلیل قدمت کتابها چسب استفاده شده در صحافی کتاب حالت لاستیکی خود رو از دست می دهد. دلیل دیگر آن نوع صحافی کتاب است. کتابهای شومیز به دلیل آنکه صفحات آن ته دوزی نمی شوند پیش از آنکه عطف کتاب چسبانده شود تیغ زده میشود، به این معنا که وقتی در دستگاه صحافی قرار میگیرد پیش از آنکه وارد مخزن چسب شود بوسیله دستگاه به صورت اوریب تیغ زده میشود. این عمل باعث میگردد تا چسب در لابلای برشها وارد شده و به استحکام کتاب بیفزاید. متاسفانه با گذشت دهه ها با وجود مدرنیزه شدن و روی کار آمدن دستگاه های جدید در ایران نه تنها کیفیت صحافی بهتر نشده بلکه تنزل نیز یافته. جنس چسب،و جنس کاغذ به مراتب میتوان گفت بدتر شده، بسیاری از کتابها رو من دیدم که اصلا تیغ زده نشده تنها وارد دستگاه گردیده و از مخزن چسب حرارتی گذشته و درنهایت برای برش نهایی فرستاده میشود. مشخصا چنین کتابی وقتی بدست مشتری میرسد با یکبار خواندن به کل شیرازه کتاب از هم می پاشد.(در دهه های گذشته تا پیش از سال 60 نیز اکثر کتابها چه شومیز و چه گالینگور بوسیله سریش چسبانده صحافی می شد،چسب صحافی تنها سه چهار دهه است که وارد صنعت صحافی ایران گردیده. به همین دلیل نیز اکثر کتابهای شومیز چاپ دهه 40 و50 و پیش از آن قبل از چسب کاری با دستگاه منگنه دوخته می شد.
در مورد تداخل رنگ صفحات کاغذ با مرکب چاپ دلیل اصلی آن بی کفیت بودن کاغذیست که در صحافی کتاب از آن استفاده میگردد. بهترین کاغذ صحافی معروف به کاغذ نخودی 80 گرمی ساخت آلمان است(رنگ نخودی صفحات کتاب برای این انتخاب می گردید تا به مرور زمان به دلیل رفلکس نور باعث ضعیف شدن و آسیب دیدگی چشم خواننده کتاب نگردد) این کاغذ مرغوب تا پیش از انقلاب وارد می گردید. با این وجود به دلیل قیمت بالای آن کمتر انتشاراتی از آن در چاپ کتابهای خود استفاده می نمود بجز انتشارات ترجمه و نشر ، انتشارات سینا ، انتشارات بنیاد فرهنگ و انتشارات امیر کبیر که گاها از این نوع کاغذ در چاپ کتابهای خود استفاده می نمودن (بخش اعظم کتابهای انتشارات ترجمه و نشر کتاب از این کاغذ با کیفیت بسیار بالا استفاده می گردید) به همین دلیل نیز با گذشت دهه ها نه کاغذ تُرد و شکننده می شد(به قول معروف آب کاغذ با گذشت زمان گرفته نمی شد) و نه مرکب چاپ بر روی کاغذ پخش می گردید.
اگر به کتاب تاریخ ایران باستان که چند روز پیش بر روی سایت بارگذاری گردید نگاه کنید (صفحات این کتاب نخودی رنگ) از همان جنس کاغذ اعلای 80 گرمی آلمانی می باشد. اگر بدانید چه مافیایی در صنعت چاپ کشور وجود دارد به کل دور مطالعه و خرید کتاب رو خط می کشیدید! برای مثال چند نمونه رو خدمتتون عرض میکنم.
[quote='sagaliga']نقل قول از Bronowski:در مورد OCR هیچکدام از برنامه های موجود، برای زبان فارسی عملکرد خوبی ندارند، ...
درود. خیلی دوست دارم این OCR مربوط به Google Drive رو امتحان کنم. ...[/quote]
وارد حساب کاربری Gmailتون بشید و از آنجا به Google Drive و امکاناتش دسترسی خواهید داشت. تا مدتی پیش این کار براحتی انجام می گرفت ولی از قرار معلوم مدتیه که دسترسی به Google Drive مسدود شده و با اینکه پیام پیوندها را نشون نمی ده اما با استفاده از فیلتر شکن میشه واردش شد. در مورد فاصله و نیم فاصله Google Drive عملکرد خوبی نداره و باید خروجی کار حتما در Word یا هر نرم افزار مشابه دیگری، ویرایش شود. دو صفحه از جلد دوم سه تفنگدار را برایتان share کردم. به جیمیلتان مراجعه کنید. ورودی و خروجی صفحات پیداست و ذکر این مطلب ضروریست که بر روی خروجی هیچگونه تغییر ویرایشی انجام نگرفته است. دقت نتیجه کار را حتی از این هم بالاتر می توان برد.
"پاریس نیامدید که در اینجا تحصیل شغل و ثروت نمائید؟ دارتنیان گفت: بلی عالیجناب ریشلیو گفت: - آیا در این مسافرت بعد از ورود به مونک برای شما حادثه ای روی نداد؟ من درست نمیدانم این حادثه چیست؟ ولی بالاخره یک حادثه بود آیا چنین نمی باشد؟ - عالیجناب اگر اجازه بفرمائید عرض می کنم جریان این حادثه از این قرار بوده که در آن روز من... - به خود زحمت ندهید. - عالیجناب من تصور کردم که میل دارید از جریان این حادثه مستحضر باشید. ریشلیو با تبسمی که نشان می داد وی به خوبی از این واقعه مستحضر میباشد و احتیاج به توضیح دار تنیان ندارد گفت: من می دانم که شما با توصیه ای بر سر آقای تره وی به پاریس آمده بودید؟ دار تنیان گفت: - بلی عالیجناب ولی بر اثر حادثه ای که در مونک برای من پیش آمد... - لابد می خواهید بگوئید توصیه ای که پدر شما برای آقای تره وی نوشته بود
مفقود گردید؟ دارتنیان با حیرت زیاد گفت: بلی عالیجناب، این موضوع نزدیک بود به کلی مرا ناامید کند اما...
- اما... آقای تره وی که مردی قیافه شناس میباشد و بخصوص هم ولایتیهای خود را خوب میشناسد به محض اینکه شما را دید دانست که دروغ نمی گوئید و میتوان از وجود شما استفاده کرد و لذا شما را وارد سپاه اسار کرد و به شما وعده داد در صورتی که ابراز لیاقت نمائید ممکن است که وارد سپاه تفنگداران شوید. دار تن یان که بیش از پیش حیرت می کرد گفت: عالیجناب من میبینم که اطلاعات شما در این خصوص خیلی زیاد است. صدراعظم فرانسه گفت: وظیفه من این است که دربارهٔ اوضاع و افراد، دارای اطلاعات باشم. و از وقتی که شما وارد سپاه اسار شدید تا امروز وقایعی چند برای شما روی داد و از جمله روزی برای گردش به شارترو رفته بودید در صورتی که بهتر بود آن روز آنجا"
[quote='Bronowski']در مورد OCR هیچکدام از برنامه های موجود، برای زبان فارسی عملکرد خوبی ندارند، ...[/quote]
درود. خیلی دوست دارم این OCR مربوط به Google Drive رو امتحان کنم. ولی مشکلم اینه که نمیتونم Drive رو باز کنم. شما چطور وارد Drive میشین؟ 95% عالیه. باورم نمیشه. البته باید دید این دقت مثلاً شامل نیم فاصله ها هم میشه یا نه. یه نکته دیگه هم هست و اون مهارت استفاده از قابلیت Replace در World هست که خیلی کلیدیه و در تصحیح متون خروجی OCR کارایی زیادی داره. همین ابزاره که باعث میشه در برابر این دقت پایین OCRهای فارسی فعلی، دست بسته مطلق نباشیم. اگه کسی میدونه لطفا راهنماییم کنه چطور Drive رو باز کنم. از همه تون متشکرم.
[quote='sagaliga']
در مورد OCR فعلاً باهات موافقم. ولی قول میدم تا چند سال دیگه نظرت تعدیل میشه. من چندین سال پیش، Readiris 11 رو امتحان کرده بودم که در مورد فارسی خیلی اسفناک بود. ولی Readiris 16 فعلی وضعیت بهتری داره، هر چند هنوز هم دقتش پایینه. باز هم مرسی[/quote]
سلام و عرض خسته نباشید خدمت sagaliga عزیز
در مورد OCR هیچکدام از برنامه های موجود، برای زبان فارسی عملکرد خوبی ندارند، اما Google Drive در این زمینه یک استثناست. برای مثال دقت خروجی OCR چند صفحه از کتاب سه تفنگدار که خودتان زحمت اسکنش را کشیده اید، بالای 95 درصد بود. بغیر از این مورد، مساله ویرایش چندنفریست که با گزینه Sharing گوگل درایو عملی شده است و براحتی می توان فرآیند تبدیل تصویر به متن را بصورت گروهی انجام داد تا عملیات با سرعت بیشتری و دقت بهتری پیش رود.
[quote='kaydan']...متاسفانه به کل شیرازه کتاب از هم پاشید و باید مجددا اون رو صحافی کنم...[/quote]
بله کریم خان. کتاب های با جلد شومیز مشکلاتی برای اسکن دارند. مشکل از هم پاشیدن شیرازه آنها وقتی حاد میشه که این کتاب ها قدیمی باشند و چسب اونها خیلی سفت شده باشه. همچنین کتاب های قدیمی دچار تیرگی صفحات میشن و کنتراست بین کلمات و رنگ پس زمینه پایین میاد و دقت استخراج متن از اونها هم پایین میاد. ولی یه کار میشه برای حفظ شیرازه اونها در هنگام اسکن کرد. باید موقع بلند کردن اونها از صفحه اسکنر، هر دو سمت چپ و راست کتاب رو بلند کنیم، نه اینکه اونها رو از یک سمت برداریم و معلق کنیم. این امر خیلی مهمه. حتی کیفیت کاغذ هم مهمه. کاغذهای خیلی کاهی، بافت خیلی غیرهمگنی هم دارند و این باعث خط ها و نقطه های اضافی در نتیجه نهایی میشه که حتی ممکنه وقتی به کتاب نگاه کنیم، اونها رو در خود کتاب هم نبینیم!
کتاب های شومیزی به نظرم فقط یک مزیت به گالینگوری ها دارند که خیلی هم مهمه: در مورد اسکنرهای A4 (که خیلی هم معمول هستند) کمتر کتاب گالینگوری هست که بشه هر دو صفحه اش رو همزمان روی اسکنر قرار داد و همین امر باعث میشه اسکن اونها تک صفحه ای انجام بشه و این یعنی دو برابر شدن زحمت اسکن در حالیکه شومیزی ها کمتر این مشکل رو دارند.
در مورد OCR فعلاً باهات موافقم. ولی قول میدم تا چند سال دیگه نظرت تعدیل میشه. من چندین سال پیش، Readiris 11 رو امتحان کرده بودم که در مورد فارسی خیلی اسفناک بود. ولی Readiris 16 فعلی وضعیت بهتری داره، هر چند هنوز هم دقتش پایینه. باز هم مرسی
[quote='Behruz67']از همه‌ی این‌ بحث‌های جالب که بگذریم، یکی به من بگه چطوری میشه این جزوه‌ی آموزشی مورد تنفر یک نفر باشه؟! [/quote]
خوب زیاد ناراحت نباشید دوست عزیز اینجا ایرانه!
[quote='Behruz67']
درود بر شما گرامی دوست
کتابهای شما دارای کیفیت عالی هستند. برای امتحان هم که شده با استفاده از قابلیت OCR گوگل درایو، یک نمونه را به متن تبدیل کنید و اگر نتیجه مورد پسند واقع شد، جزوه آموزشی مختصری در این مورد تهیه کرده و در اختیار علاقمندان قرار دهید.
فقط محض یادآوری اینکه Dpi خروجی فایلهای اسکن شده را در برنامه ScanKromsator روی 600 قرار داده و فرمت صفحات را هم به PNG تغییر دهید. بقیه امور با Google Drive .[/quote][/quote][/quote]
ممنون از لطفتون دوست عزیز،حقیقتش من توی اسکن کتاب تاحدود زیادی وسواس دارم و دوست دارم اگر قراره کاری انجام بدیم چه بهتر تاحد ممکن به بهترین نحو باشه. معرفی برنامه فوق بسیار مفید و ارزنده بود و مطمئنم کیفیت کتابهای بعدی بهتر نیز خواهد شد. فقط یکی دو مشکل عمده وجود داره. متاسفانه اسکنر من با وجود حرفه ای بودن ولی مخصوص اسکن کتاب نیست(مدلی که به شیرازه و عطف کتاب فشار وارد نمی کنه برای مثال مدل Plustek OpticBook) به همین دلیل وقتی یک کتاب با جلد شیمیز رو اسکن میکنم به صفحه آخر که میرسم(به دلیل فشار بر روی شیرازه و عطف کتاب) دیگه جنازه کتاب تو دستم می مونه که باید برم خاکش کنم!(کتاب خاطرات سرآرتور هاردینگ) متاسفانه به کل شیرازه کتاب از هم پاشید و باید مجددا اون رو صحافی کنم.
این موضوع باعث شده که دیگه جرات نکنم کتابهای با جلد شیمیز رو اسکن کنم، در صورتی که کتابهای بسیار ارزشمندی به صورت شیمیز وجود داره. مثلا نقط مکی که یک کتاب بسیار ارزشمند در زمینه تحقیق در زمینه درگیریهای مجلس و مصدق بر سر ملی شدن نفت می باشد. یا اسناد مشروطه گردآوری زنده یاد افشار و...بسیاری دیگر.
مورد دوم اینکه به دلیل تعداد زیاد کتابها حتی فرصت برای اسکن این کتابها به روش کنونی نیز وجود نداره،چه رسد به اینکه وقت برای تبدیل آن به فرمت ocr نمایم. مطمئنم که روشی که معرفی کردید بسیار عالیه خصوصا که در فرمت ocr قابلیت جستجوی متن، تبدیل به فرمت های نوشتاری و بسیاری قابلیت های دیگر وجود داره، با این حال طبق راهنمایی شما سعی میکنم یک مورد رو به این صورت اسکن نمایم برای تجربه هم که باشه بد نیست.
راهنمای تهیه کتاب الکترونیکی
عضو نیستید؟
ثبت نام در کتابناک