Ricerca in modo unificato ed efficiente tra tutti i tuoi dati e documenti

ColumbusDoc è
  • veloce
  • affidabile
  • duttile
  • semplice
  • compatibile

Highlights

  • Restituisce i risultati in meno di un secondo

  • Indicizza account di posta e dischi cloud

  • Consente di eseguire ricerche complesse in modo semplice e diretto

  • Puoi salvare le ricerche e condividere i risultati con altri utenti

  • Permette di formulare domande in linguaggio naturale

Molteplici sorgenti

Il sistema è in grado di cercare in modo del tutto trasparente per l’utilizzatore dati e documenti provenienti da molteplici fonti archiviati in formati differenti, tra cui:
outlook.com | exchange online | IMAP | Gmail | Onedrive Personal ed Enterprise | DropBox | Gdrive | Rubriche contatti di Outlook  e Gmail |

Velocità di consultazione

Possibilità di accedere alla specifica pagina del documento contenente l’informazione cercata in modo diretto, minimizzando i tempi di apertura e navigazione del documento stesso, sopratutto con i documenti di dimensioni significative.

Unico contenitore personale

Possibilità di accedere ad un unico contenitore, dentro al quale sono effettivamente ricercabili ed accessibili per la consultazione tutte le informazioni utili. Sia quelle utilizzate in ambito lavorativo che eventualmente quelle disponibili privatamente.

Velocità di ricerca

Restituzione del risultato della ricerca in meno di 1 secondo

Annotazioni

Annotazioni di testo semplici
Annotazioni strutturate, manuali ed automatiche

Personal

Spazio di ricerca di contenuti personali da fonti private e aziendali

Caratteristiche

ACQUISIZIONE DATI E DOCUMENTI

Il sistema acquisisce informazioni da svariate sorgenti specificate dall’utente (o dall’amministratore del sistema) che rispettino le seguenti condizioni:
  • Il legittimo proprietario abbia concesso le necessarie autorizzazione all’accesso
  • La sorgente supporti l’accesso mediante interfaccia API o sia accessibile da parte di columbus attraverso un connettore custom appositamente scritto ed autorizzato
TRASFORMAZIONE
I diversi elementi documentali acquisiti hanno formati differenti.
Questa attività uniforma il formato di tutti gli elementi acquisiti al fine di ottenere documenti pdf ricercabili. A seconda del formato dell’elemento acquisito, la trasformazione può o meno includere attività differenti, quali rendering, scansione, OCR, conversione, esportazione.
ARCHIVIAZIONE OTTIMIZZATA
Il sistema procede ad archiviare in modo ottimizzato gli elementi trasformati, utilizzando storage dedicati in grado di massimizzare le performance di accesso a consultazione.
Nel rispetto della privacy e della sicurezza di accesso, vengono risolti tutti i problemi di duplicazione di contenuto che spesso si presentano nell’ambito di comunicazioni tra membri della stessa organizzazione (si pensi all’allegato di una mail a volte presente in decine di elementi, ma pur sempre unico come contenuto).
Il sistema provvede quindi ad archiviare un’unica copia di qualsiasi contenuto, identificandoli tramite funzioni di hashing e garantendo quindi, oltre al risparmio di spazio, anche il risparmio delle attività di trasformazione in caso di contenuto già trattato;
I documenti pdf ricercabili vengono archiviati anche in modalità paginata: in altre parole, il sistema provvede ad archiviare una conversione che consente di consultare una singola pagina del documento senza accedere all’intero documento. Si pensi, ad esempio, ad una ricerca che abbia identificato risultati presenti solo in alcune delle centinaia pagine di un determinato documento: l’archiviazione paginata consente di accedere immediatamente l contenuto senza dover scaricare preventivamente l’intero file.
CLASSIFICAZIONE E INDICIZZAZIONE
La fase di classificazione applica a tutti i documenti acquisiti una serie di algoritmi automatici in grado di estrarre annotare informazioni strutturate, che possono essere sia tecniche che funzionali.
Gli algoritmi di estrazione automatica delle informazioni sono combinabili secondo le necessità del cliente: è possibile quindi selezionare quali algoritmi devono essere installati, quanta capacità computazionale devono assorbire, e in che ordine devono essere eseguiti. Possono inoltre essere scritti ed installati algoritmi custom capaci di applicare logiche specifiche nell’individuazione ed estrazione dei dati strutturati. E’ inoltre possibile installare algoritmi che utilizzino servizi esterni di intelligenza artificiale, in grado di estendere ulteriormente le capacità di analisi automatica del sistema.
L’insieme di questi metadati viene poi utilizzato per arricchire la fase di indicizzazione e rendere il sistema in grado di ricercare il patrimonio informative combinando metodiche di ricerca full-text con quelle di ricerca su dati strutturati. Le informazioni strutturate, inoltre, sono un elemento fondamentale dalla capacità del sistema di consentire la ricerca esplorativa, fornendo diversi percorsi semantici di raffinamento dei risultati ottenuti.
Durante la fase di indicizzazione, vengono inoltre impostate le informazioni necessarie per garantire la sicurezza nell’accesso al patrimonio informativo, secondo meccanismi di partizionamento e condivisione, in grado di garantire che ogni utente possa ricercare solo all’interno del patrimonio a cui ha diritto di accedere.
RICERCA E CONSULTAZIONE
Al termine delle attività di classificazione e indicizzazione, il sistema mette a disposizione diverse modalità di ricerca, sia in termini funzionali che architetturali.
Ricerca attraverso il client columbus: il client dedicato, disponibile sia in modalità desktop (utilizzabile da un PC Windows) che (opzionalmente) anche in modalità mobile (utilizzabile da uno smartphone/tablet iOs/Android/Windows), mette a disposizione l’intero set di funzioni di ricerca disponibile.
La ricerca è possibile combinando elementi full-text presenti all’interno del testo del documento indicizzato con filtri sui diversi set di metadati estratti dal sistema.
Il risultato ottenuto è poi raffinabile attraverso un sistema di faceting totalmente basato sui metadati estratti. La selezione delle facet è possibile in termini di inclusione e di esclusione, rappresentando un potente e intuitivo meccanismo di selezione utile alla rapida individuazione dei contenuti ricercati.
Il sistema consente inoltre anche la cosiddetta ‘ricerca esplorativa’ che permette di esplorare l’intero patrimonio informativo senza introdurre alcuna query iniziale ma utilizzando esclusivamente il meccanismo di faceting. L’architettura del sistema consente di effettuare queste operazioni mantenendo l’efficienza prestazionale attesa.
Ricerca attraverso l’API: le principali funzionalità di ricerca sopradescritte sono disponibili anche per l’integrazione con altri sistemi, che utilizzando l’API disponibili ed i meccanismi di sicurezza opportuni, possono interrogare il sistema ed ottenere dati in formati standard da utilizzare per le proprie necessità.
CONDIVISIONE
Ogni utente, se autorizzato attraverso le funzioni amministrative del sistema, ha la possibilità di condividere i risultati delle proprie ricerche con altri utenti.
In particolare, attraverso le funzionalità di ‘smart sharing’, l’utente ha la possibilità di condividere informazioni seguendo una logica funzionale e non strettamente legata ai meccanismi tipici di sicurezza derivanti dalle ACL (utenze e gruppi). L’utente ha la facoltà di condividere basandosi sulla classificazione delle informazioni e/o sul risultato di ricerche full-text. In questo modo la condivisione risulta maggiormente intuitiva e può essere effettuata sulla base di regole funzionali capaci di condividere nel tempo anche nuovi elementi che dovessero soddisfare le regole stabilite. Ad esempio, se l’utente condivide tutti i documenti di un determinato anno che trattano uno specifico argomento, tutti i successivi elementi indicizzati dal sistema che rispettano tale regola verranno condivisi senza ulteriore intervento