Uno strumento di analisi pap-striscio (PAT) per il rilevamento del cancro cervicale da immagini pap-striscio
- Analisi delle immagini
- acquisizione di Immagini
- Miglioramento dell’immagine
- Segmentazione delle scene
- Rimozione dei detriti
- Analisi delle dimensioni
- Analisi della forma
- Analisi della trama
- Feature extraction
- Selezione delle caratteristiche
- La defuzzificazione
- Valutazione della classificazione
- GUI design and integration
Analisi delle immagini
La pipeline di analisi delle immagini per lo sviluppo di uno strumento di analisi pap-striscio per il rilevamento del cancro cervicale da pap-strisci presentato in questo articolo è raffigurato in Fig. 1.
acquisizione di Immagini
L’approccio è stata valutata utilizzando tre set di dati. Dataset 1 è costituito da 917 singole celle di Harlev pap-striscio immagini preparate da Jantzen et al. . Il set di dati contiene immagini pap-striscio scattate con una risoluzione di 0,201 µm / pixel da citopatologi esperti utilizzando un microscopio collegato a un frame grabber. Le immagini sono state segmentate utilizzando il software commerciale CHAMP e quindi classificate in sette classi con caratteristiche distinte come mostrato nella Tabella 2. Di queste 200 immagini sono state utilizzate per la formazione e 717 immagini per i test.
set di dati 2 si compone di 497 completo della presentazione pap-test immagini preparato da Norup et al. . Di queste 200 immagini sono state utilizzate per la formazione e 297 immagini per i test. Inoltre, le prestazioni del classificatore sono state valutate sul set di dati 3 di campioni di pap-strisci 60 (30 normali e 30 anormali) ottenuti dall’ospedale regionale di riferimento di Mbarara (MRRH). I campioni sono stati fotografati utilizzando un microscopio Olympus BX51 a campo luminoso dotato di un obiettivo 40×, 0,95 NA e una fotocamera monocromatica Hamamatsu ORCA-05G 1,4 Mpx, con una dimensione in pixel di 0,25 µm con profondità di grigio a 8 bit. Ogni immagine è stata poi divisa in 300 aree con ogni area contenente tra 200 e 400 celle. Sulla base delle opinioni dei citopatologi, sono stati selezionati 10.000 oggetti in immagini derivate dai 60 diversi vetrini pap-striscio, di cui 8000 erano cellule epiteliali cervicali libere (3000 cellule normali da strisci normali e 5000 cellule anormali da strisci anormali) e i restanti 2000 erano oggetti detriti. Questa segmentazione pap-smear è stata ottenuta utilizzando il toolkit di segmentazione Weka addestrabile per costruire un classificatore di segmentazione a livello di pixel.
Miglioramento dell’immagine
All’immagine in scala di grigi è stata applicata un’equalizzazione dell’istogramma adattivo locale a contrasto (CLAHE) per il miglioramento dell’immagine . In CLAHE, la selezione di clip-limit che specifica la forma desiderata dell’istogramma dell’immagine è fondamentale, in quanto influenza criticamente la qualità dell’immagine migliorata. Il valore ottimale del limite di clip è stato selezionato empiricamente utilizzando il metodo definito da Joseph et al. . Un valore limite di clip ottimale di 2.0 è stato determinato come appropriato per fornire un adeguato miglioramento dell’immagine preservando le caratteristiche scure per i set di dati utilizzati. La conversione in scala di grigi è stata ottenuta utilizzando una tecnica in scala di grigi implementata utilizzando Eq. 1 come definito in .
dove R = Rosso, G = Verde e B = contributi di colore blu alla nuova immagine.
L’applicazione di CLAHE per il miglioramento dell’immagine ha comportato notevoli cambiamenti alle immagini regolando le intensità dell’immagine in cui l’oscuramento del nucleo, così come i confini del citoplasma, sono diventati facilmente identificabili utilizzando un limite di clip di 2.0.
Segmentazione delle scene
Per ottenere la segmentazione delle scene, è stato sviluppato un classificatore a livello di pixel utilizzando il toolkit Weka Segmentation (TWS) addestrabile. La maggior parte delle cellule osservate in un pap-striscio non sono sorprendentemente cellule epiteliali cervicali . Inoltre, il numero variabile di leucociti, eritrociti e batteri è generalmente evidente, mentre a volte si osservano piccoli numeri di altre cellule e microrganismi contaminanti. Tuttavia, il pap-striscio contiene quattro tipi principali di cellule cervicali squamose-superficiali, intermedie, parabasali e basali—di cui le cellule superficiali e intermedie rappresentano la stragrande maggioranza in uno striscio convenzionale; quindi questi due tipi sono solitamente utilizzati per un’analisi pap-striscio convenzionale . Una segmentazione Weka addestrabile è stata utilizzata per identificare e segmentare i diversi oggetti sulla diapositiva. In questa fase, un classificatore a livello di pixel è stato addestrato su nuclei cellulari, citoplasma, identificazione di sfondo e detriti con l’aiuto di un citopatologo esperto utilizzando il toolkit di segmentazione Weka (TWS) addestrabile . Ciò è stato ottenuto disegnando linee / selezione attraverso le aree di interesse e assegnandole a una particolare classe. I pixel sotto le linee / selezione sono stati presi per essere il rappresentante dei nuclei, del citoplasma, dello sfondo e dei detriti.
I contorni disegnati all’interno di ogni classe sono stati utilizzati per generare un vettore di funzionalità, \(\mathop F\limits^{ \to }\) che è stato derivato dal numero di pixel appartenenti a ciascun contorno. Il vettore di funzionalità di ogni immagine (200 dal set di dati 1 e 200 dal set di dati 2) è stato definito da Eq. 2.
dove Ni, Ci, Bi e Di sono il numero di pixel dal nucleo, citoplasma, sfondo e detriti dell’immagine \(i\) come mostrato in Fig. 2.
Ogni pixel estratti dall’immagine rappresenta non solo la sua intensità, ma anche una serie di caratteristiche dell’immagine che contengono un sacco di informazioni, tra cui consistenza, confini e colori all’interno di un’area di pixel di 0.201 µm2. La scelta di un vettore di funzionalità appropriato per addestrare il classificatore è stata una grande sfida e un compito nuovo nell’approccio proposto. Il classificatore di livello pixel è stato addestrato utilizzando un totale di 226 funzioni di allenamento da TWS. Il classificatore è stato addestrato utilizzando una serie di funzioni di addestramento TWS che includevano: (i) Riduzione del rumore: I filtri Kuwahara e bilaterali nel toolkit TWS sono stati utilizzati per addestrare il classificatore sulla rimozione del rumore. Questi sono stati segnalati come filtri eccellenti per rimuovere il rumore preservando i bordi , (ii) Rilevamento dei bordi: un filtro Sobel, una matrice di Hessian e un filtro Gabor sono stati utilizzati per addestrare il classificatore sul rilevamento dei bordi in un’immagine e (iii) Filtraggio delle texture: I filtri media, varianza, mediana, massima, minima e entropia sono stati utilizzati per il filtraggio delle texture.
Rimozione dei detriti
La ragione principale per le attuali limitazioni di molti dei sistemi di analisi pap-striscio automatizzati esistenti è che lottano per superare la complessità delle strutture pap-striscio, cercando di analizzare la diapositiva nel suo complesso, che spesso contengono più celle e detriti. Ciò ha il potenziale di causare il fallimento dell’algoritmo e richiede una maggiore potenza computazionale . I campioni sono coperti da artefatti – come cellule del sangue, cellule sovrapposte e piegate e batteri—che ostacolano i processi di segmentazione e generano un gran numero di oggetti sospetti. È stato dimostrato che i classificatori progettati per differenziare tra cellule normali e cellule precancerose di solito producono risultati imprevedibili quando esistono artefatti nel pap-test . In questo strumento, una tecnica per identificare le cellule della cervice utilizzando uno schema di eliminazione sequenziale trifase (raffigurato in Fig. 3) è usato.