طبقه بندی و بایگانی اسناد
امروزه مشكلی اساسی كه مشاغل و مؤسسات با آن ها روبرو هستند، اضافه بار اطلاعات است. طبقه بندی و بایگانی اسناد مفید از اسنادی که مورد علاقه آنها نیست نبوغ و منابع افراد و سازمان ها را به چالش می کشد.
درباره عملکرد بایگانی ریلی بیشتر بدانید.
بدون در نظر گرفتن نوع صنعت، وجود اطلاعات بیش از حد، به عنوان معضلی است که بسیاری از سازمان ها با آن روبرو هستند، وقت و پول بسیاری از مردم و شرکت های بزرگ را تلف می کند.
وقتی نوبت به جداسازی اطلاعات مفید از نا مربوط میرسد، طبقه بندی و بایگانی اسناد وسیله ای ازشمند است که می تواند زمان و هزینه جست و جو و بازیابی اطلاعات را کاهش دهد.
درباره تفاوت کمد بایگانی و کمد بایگانی ریلی شرکت اوژن بیشتر بدانید.
طبقه بندی و بایگانی اسناد یا مرتب سازی آن ها یک مشکل در علم کتابخانه، علوم اطلاعات و علوم رایانه است. روش کار به این ترتیب است که یک سند را به یک یا چند کلاس یا دسته اختصاص دهید. این ممکن است دستی(یا فکری) یا الگوریتمی انجام شود. طبقه بندی فکری اسناد بیشتر مختص علوم کتابخانه می باشد، در حالی که طبقه بندی الگوریتمی اسناد عمدتاً در علم اطلاعات و علوم رایانه است. با این حال، مشکلات با هم همپوشانی دارند، بنابراین تحقیقات بین رشته ای در مورد طبقه بندی و بایگانی اسناد وجود دارد.
درباره تفاوت کمد کتابخانه و کمد کتابخانه ریلی شرکت اوژن بیشتر بدانید.
اسناد قابل طبقه بندی ممکن است متون، تصاویر، موسیقی و غیره باشد. هر نوع سند دارای مشکلات طبقه بندی ویژه خود است. هنگامی که در غیر این صورت مشخص نشده است، طبقه بندی متن دلالت دارد.
اسناد ممکن است با توجه به موضوعاتشان یا با توجه به سایر خصوصیات (مانند نوع سند، نویسنده، سال چاپ و غیره) طبقه بندی شوند. در بقیه این مقاله فقط طبقه بندی موضوع در نظر گرفته شده است.
طبقه بندی “مبتنی بر محتوا” در مقابل “درخواست محور”
دو طبقه بندی اصلی درباره طبقه بندی و بایگانی اسناد در رابطه با موضوع آن ها وجود دارد: رویکرد محتوا و رویکرد مبتنی بر درخواست.
درباره کمد بایگانی کشویی شرکت اوژن بیشتر بدانید.
طبقه بندی مبتنی بر محتوا
طبقه بندی است که در آن وزنی که به افراد خاص در یک سند داده می شود، طبقه ای را که سند به آن اختصاص می یابد، تعیین می کند. برای مثال، این یک قاعده مشترک برای طبقه بندی در کتابخانه ها است که حداقل 20٪ از محتوای یک کتاب باید مربوط به صنفی باشد که به آن کتاب اختصاص داده شده است. در طبقه بندی خودکار می تواند تعداد دفعاتی باشد که کلمات در یک سند ظاهر می شوند.
طبقه بندی درخواست گر
طبقه بندی است که در آن درخواست پیش بینی شده از کاربران بر نحوه طبقه بندی اسناد تأثیر می گذارد. طبقه بندی کننده از خود می پرسد: “این موجودیت ها را تحت کدام توصیف ها باید یافت؟” و “به تمام سؤالات احتمالی فکر کنید و تصمیم بگیرید که موجودیت در کدام یک از این موارد مرتبط است.
طبقه بندی درخواست-گرا ممکن است طبقه بندی باشد که به سمت مخاطبان یا گروه کاربر خاصی هدف قرار گیرد. به عنوان مثال، یک کتابخانه یا بانک اطلاعاتی برای مطالعات فمینیستی ممکن است در مقایسه با یک کتابخانه تاریخی، اسناد را به گونه دیگری طبقه بندی و فهرست کند. با این وجود، شاید درک بهتر طبقه بندی درخواست محور به عنوان طبقه بندی مبتنی بر سیاست بهتر باشد. طبقه بندی طبق بعضی از ایده آل ها انجام می شود و منعکس کننده هدف کتابخانه یا بانک اطلاعاتی انجام طبقه بندی است. به این ترتیب لزوماً نوعی طبقه بندی یا فهرست بندی بر اساس مطالعات کاربر نیست. فقط در صورت استفاده از داده های تجربی در مورد استفاده یا کاربران باید طبقه بندی درخواست گرا به عنوان یک رویکرد مبتنی بر کاربر در نظر گرفته شود.
طبقه بندی و بایگانی اسناد چگونه کار می کند؟
طبقه بندی و بایگانی اسناد یک مسئله قدیمی در بازیابی اطلاعات است و نقش مهمی در انواع برنامه ها برای مدیریت به طور موثر متن و حجم زیادی از اطلاعات بدون ساختار دارد. طبقه بندی خودکار اسناد را می توان به عنوان انتساب محتوا از یک یا چند دسته از پیش تعریف شده (موضوعات) به اسناد تعریف کرد. این امر باعث می شود اطلاعات مناسب در زمان مناسب و برای فیلتر و مسیریابی اسناد به طور مستقیم در اختیار کاربران قرار گیرد.
طبقه بندی و بایگانی اسناد دو روش مختلف دارد: طبقه بندی دستی و اتوماتیک.
طبقه بندی دستی
در طبقه بندی و بایگانی اسناد دستی، کاربران معنی متن را تفسیر می کنند، روابط بین مفاهیم را مشخص می کنند و اسناد را طبقه بندی می کنند. در حالی که این کنترل بیشتری را برای کاربران در اختیار طبقه بندی قرار می دهد، طبقه بندی دستی هم گران است و هم وقت گیر.
طبقه بندی اتوماتیک
طبقه بندی خودکار اسناد از یادگیری ماشین یا سایر فناوری ها برای طبقه بندی خودکار اسناد استفاده می کند. این منجر به طبقه بندی سریع تر ، مقیاس پذیرتر و عینی تر می شود.
همچنین مقاله کارتابل چیست و انواع آن را مطالعه کنید.
حداقل 3 رویکرد در طبقه بندی و بایگانی اسناد وجود دارد:
روش نظارت:
طبقه بندی اگر بر روی مجموعه ای از اسناد دارای برچسب دستی آموزش می یابد. طبقه بندی کننده می تواند مقوله های جدید را پیش بینی کند و همچنین می تواند یک شاخص اطمینان داشته باشد. با طبقه بندی اسناد نظارت شده، کاربر مجموعه ای از اسناد را برچسب می زند که سیستم خودکار می تواند به عنوان یک مدل از آنها استفاده کند.
روش بدون نظارت:
اسناد بر اساس كلمات و اصطلاحات مشابه به صورت رياضي تشكيل مي شوند.
روش مبتنی بر قواعد:
این روش شامل استفاده از توانایی درک زبان طبیعی یک سیستم و نوشتن قواعد زبانی است که به سیستم دستور می دهد مانند یک شخص در طبقه بندی یک سند عمل کند. این به معنی استفاده از عناصر معنایی مرتبط با متن برای هدایت طبقه بندی خودکار است. این روش از مزیت ارتقاء مداوم عملکرد (رویکرد جعبه باز) به جای تکیه صرف بر آمار یا ریاضیات مانند دو روش قبلی برخوردار است. این روش به ویژه در سناریوهای پیچیده با عملکرد با کیفیت بالاتر همراه است.
با طبقه بندی متن، ما قصد داریم یک یا چند کلاس یا دسته را به یک سند اختصاص دهیم و مدیریت و مرتب سازی آن را آسان تر کنیم. این امر به ویژه برای ناشران، مؤسسات مالی، شرکت های بیمه یا هر صنعتی که با مقادیر زیادی محتوا سر و کار دارد مفید است. یک ابزار طبقه بندی خودکار اسناد می تواند کاهش قابل توجهی در هزینه های دستی داشته باشد و سرعت و زمان چرخش را برای پردازش اسناد بهبود بخشد.
چرا هوش معنایی بهترین گزینه برای طبقه بندی و بایگانی اسناد است؟
فن آوری معنایی با تکیه بر انواع تکنیک های زبانی از جمله استخراج متن، استخراج موجودات، تحلیل مفهوم، پردازش زبان طبیعی، طبقه بندی و تحلیل احساسات، پردازش و تفسیر مطالب را انجام می دهد. فن آوری معنایی امکان درک خودکار کلمات و کل اسناد را می دهد و معانی کلمات را در متن درک می کند.
برخلاف کلمات کلیدی و فن آوری های آماری که محتوا را به عنوان داده پردازش می کنند، فناوری معنایی نه تنها در داده بلکه بر اساس روابط بین داده ها استوار است. این توانایی در درک کلمات در متن همان چیزی است که باعث می شود طبقه بندی اتوماتیک امکان پذیر باشد، و نه تنها مدیریت حجم زیادی از داده ها بلکه امکان بهینه سازی آن را برای تجزیه و تحلیل و حتی بیشتر اطلاعات امکان پذیر می سازد.
اوژن ، کیمیاگر فضا در دنیای بایگانی اسناد و انبار کالا
منبع: www.ozhanco.com