DocsCorp Content Crawler

pdf indir

Dijital çağda bilgiye erişim çok önem kazandı. Kurumlar, Doküman Yönetim Sistemleri gibi içerik depolayıcılarına ve ayrıca arama teknolojilerine büyük yatırımlar yaparak önemli kurumsal bilgilerine erişimi garantilemek istiyorlar. Bu yatırımlara rağmen Content Repository içindeki dokümanların %20’si aranabilir olmayabilir ve arama teknolojileri tarafından ‘görünmez’.

 • Her doküman düzenlenebilir ve aranabilir
 • Kritik kurumsal bilgilere erişim
 • Uyumsuzluğu ve bulunamayan riski azaltma
 • Otomatikleştirilmiş işakışları ile verimliliği artırma
 • Doküman yönetim sistemi ve arama teknolojilerine yatırımın değerini en üst düzeye çıkartır
 • OpenText eDOCS DM başta olmak üzere birçok doküman yönetim sistemi ile entegrasyon
 • MS Windows dosya sistemleri ile entegrasyon

RİSK ÇOK FAZLA

Kritik kurumsal dokümanlara erişim sağlanamaması, bilgi taleplerine uyumsuzluk ile verimliliği ve üretimi düşürebilir, aynı zamanda kurumların ismini ve finansal durumunu riske atabilir.

KAYNAKLAR ÇOK FAZLA

Fakslar, PDF’ler ve taranmış dokümanlar gibi resim-bazlı dosyalar doküman yönetim sistemleri içerisinde profillenir yada eposta eklentileri, yasal dokümanlar, mobil teknoloji, satınalma dokümanları ve dava dosyaları gibi bir çok doküman süreç yoğunlukları arasında, Microsoft Windows klasörleri içine saklanır. Bu dokümanlar, arama teknolojinize karşı ‘görünmez” dir.

ÇÖZÜM BASİT

Crawler, dokümanlarınızı %100 aranabilir hale getirerek dokümanlara erişimi güvence altına alır..

ARANAMAYAN İÇERİĞİN KAYNAKLARI

 • TIFF yada imaj PDF olarak saklanan taranmış resimler
 • TIFF yada imaj-bazlı PDF eklentilerine sahip epostalar
 • TIFF yada PDF olarak saklanan elektronik fakslar
 • Kurumsal satınalmalar yada dava dosyaları ile ilgili imaj, PDF yada eposta dokümanları

ARANAMAYAN İÇERİĞİN RİSKLERİ

 • Dava, proje yada konuyla ilgili kritik dokümanların bulunamaması
 • Yasal otoritelerce talep edilen dokümanlara erişim sağlanmaması ile oluşan uyumsuzluk
 • Kayıp dokümanların aranması için harcanan ekstra çaba ve verimlilik kaybı
 • Doküman yönetim sistemleri ve arama teknolojilerine yapılan yatırımların maksimuma çıkarılmaması
 • Doküman yönetim sistemlerinde içerik bulunamazsa kullanıcının güveni kaybolur

DÜZENLENEBİLİR VE ARANABİLİR

Content Crawler, Windows dosyaları, DMS veritabanı yada belirli bir sorguya bağlı dokümanların alt grupları gibi içerik depolayıcılarını arayabilmek için oluşturulmuş bir çerçeve modeldir. Content Crawler, aranamayan içerikleri tanımlar, bunları DocsCorp OCR teknolojisini kullanarak aranabilir PDF haline dönüştürür ve tekrar Content Repository içine saklar. Doküman yönetim sistemleri için dokümanlar, resim dokümanları olarak tanımlanır tanımlanan dokümanlar dokümanın yeni versiyonu, ek, yeni yorumu yada ilgili dokümanı (doküman yönetim sistemine bağlı olarak) olarak saklanır. Aramayı kolaylaştırmak için dokümana bir metin katmanı eklenmiş olur..

ENTEGRASYON

 • Microsoft Windows dosya sistemleri
 • OpenText eDOCS DM
 • OpenText Content Server
 • MS SharePoint (yakında)

ESNEK KONFİGÜRASYON

 • İçerik depolayıcılara erişim için çeşitli ‘hizmet’ler oluşturma
 • İçerik depolayıcısı içindeki dokümanların metin aranabilirliğini değerlendirme
 • Aranabilir yazılı dokümanlarda karakter tanıma işlemi
 • Gizli metin katmanının PDF’e eklenmesi ve içerik depolayıcısı içine saklanması

DÖKÜMAN YÖNETİM SİSTEMLERİ ARAMA

 • Doküman yönetim sistemlerindeki resim dokümanları, resim PDF’leri ve eposta dosyaları varsayılan olarak tanımlanabilir
 • TIFF, JPG, PNG ve BMP resim dosyalarını destekler
 • Çoklu veritabanı yada kütüphane erişimi sağlar

WINDOWS DOSYA SİSTEMİ

 • Microsoft Windows dosyalarındaki aranamayan içerikleri aratır
 • Resim-bazlı PDF’ler, JPEG, TIFF, PNG, BMP ve eposta mesajlarını aratır

METİN ARANABİLİRLİĞİNİ DEĞERLENDİRME

 • Resim dosyaları, PDF’ler ve eposta eklentileri gibi aranabilir olmayan içeriğin tümünü kontrol eder
 • Çok az yazılı ya da yazısız PDF’leri tanımlar. Metin-bazlı PDF’ler zaten metin-aranabilir durumda oldukları için işlenmeyecektir.
 • Eklerin metin-aranabilirliğini değerlendirmek için bir içerik depolayıcısı içinde depolanan epostaları kontrol eder
 • Eğer uygunsa eposta eklentilerini karakter tanımla ile işlenmiş PDF’ler ile değiştirir

ARANABİLİR YAPMA (OCR)

 • Dokümanlar gizli bir metin katmanına sahip yeni bir PDF oluşturmak için OCR teknolojisini kullanarak işlenir
 • Resim yada PDF dosyasından ayrı bir metin dosyasına gerek yoktur
 • Metin katmanı aranabilir özelliktedir
 • Adobe Acrobat yada Adobe Reader’ın arama özelliklerini arama ve inceleme için kullanabilir

DOKÜMAN YÖNETİM SİSTEMLERİNE KAYDETME

 • OpenText eDOCS DM 5.1.05 ve üstü, ve OpenText Content Server 9.7.1 ve 10 ile entegredir
 • Bütün bağlantı için DMS API kullanır – bütün güvenlik modelleri ve ayrıcalıkları korunur
 • Karakter bazlı hale dönüştürülen PDF’i DMS içine yeni versiyon, ilişkili doküman, yeni, yorum ya da ek olarak kaydedilebilir

DENETİM VE RAPORLAMA

 • Çalışmaların ayarlanması, izlenebilmesi ve raporlanması için zengin yönetici paneli
 • OCR öncesinde ‘Hold for Review’ ve/veya ‘Save to Content Repository’ adımları ile maksimum kontrol
 • Gerekli durumlarda daha zengin raporlama için gömülü Microsoft SQL veritabanı

AKTİF İZLEME

 • Aktif denetleme özelliği ile ile Content Crawler’ın koruması otomatikleştirilebilir
 • Tercih doğrultusunda belirli zamanlarda çizelgelenmiş olarak ya da yeni profillenmiş dokümanlar metin bazlı hale dönüştürülür ve değerlendirilir
 • İçerik depolayıcılarındaki dokümanlarını aranabilir yapmak için işakışları otomatikleştirilebilir

keyboard_arrow_up