Ärge laske pressieelsel protsessil uuesti aeglustuda! Meie enda väljatöötatud{0}}tööriistad on suurendanud tõhusust peaaegu 10 korda
Arengu taust: tuleneb tegelikest tootmisvajadustest
Trükieelne dokumentide töötlemine digitaaltrükis võtab liiga palju aega. Pärast suhtlemist eesliinioperaatoritega tehti kindlaks ja selgitati välja kolm põhivajadust.
(1) Partiikontrolli dokumendi lehekülgede arv: printimise ja küljendamise ajal on sageli vaja tagada, et dokumendil oleks paarisarv lehti; vastasel juhul võib see kergesti põhjustada trükimaterjalide raiskamist või köitmisvigu.
(2) Paaritu-leheküljeliste dokumentide automaatne haldamine: paaritute lehekülgedega dokumentide lõppu tuleb lisada tühjad lehed, samas kui paarislehed jäävad muutumatuks.
(3) Partii kontrollimine, kas tekst on kõver: puuduvatest fontidest põhjustatud prindivigade vältimiseks veenduge, et dokumendi tekst on teisendatud kõverateks (st "kõveraks").
Adobe Acrobati ja erinevate turul leiduvate PDF-i töötlemise pluginate uurimise käigus selgus, et olemasolevad tööriistad on kas funktsionaalselt üleliigsed ja keerukad või ei ühti ettevõtte tegelike tootmisprotsessidega, eriti varjatud riskidega inversioonitöötluse turvalisuses. Veelgi olulisem on see, et sarnased kodumaised tööriistad nõuavad sageli tasu, mille tulemuseks on pikaajalised{1}}kasutuskulud. Nendest praktilistest probleemidest lähtudes otsustas ettevõte välja töötada kerge, täpse ja sisemiselt kohandatud spetsiaalse tööriista.
PDF-i lehekülgede arvu kontrollimise ja töötlemise tööriist
01
Põhifunktsioonid ja otsustusloogika
Selle tööriista põhieesmärk on tagada, et kõigil prinditavatel dokumentidel oleks paarisarv lehti. Kohtuotsuse ja täitmise lähenemisviis on järgmine.
(1) Lehekülje tuvastamise mehhanism: loeb PyMuPDF-i teegi kaudu PDF-dokumentide metaandmeid, et saada otse lehe koguteavet.
(2) Pariteediloogika otsus: kasutage paarsuse määramiseks mooduloperatsiooni (lehekülg number %2). Kui tulemus on 1, määratakse see paarituteks lehekülgedeks; kui see on 0, loetakse see paarisarvuks.
(3) Diferentseeritud töötlemisstrateegia: paaritute -numbritega lehekülgede jaoks lisage dokumendi lõppu automaatselt üks tühi leht, mis vastab originaaldokumendi suurusele; Ühtlaste-lehekülgede dokumentide puhul hoidke sisu muutmata ja kopeerige otse väljundkataloogi.
(4) Turvalisuse käsitlemise põhimõte: kõik töödeldud dokumendid salvestatakse määratud kataloogi "Töödeldud failid", kusjuures originaalfailid säilitatakse, et vältida väärkasutusest põhjustatud failikahjustusi, nagu on näidatud joonisel 1.
Joonis 1 PDF-i lehtede loenduse kontrollimise ja töötlemise tööriista liides
02
Tehnilised rakenduspunktid
Tööriist kasutab graafilise liidese koostamiseks Tkinterit ja sisaldab peamiselt kolme funktsionaalset moodulit.
(1) Kataloogi valimise moodul: toetab lähtefaili kataloogi ja väljundkataloogi visuaalset valimist, kusjuures vaikimisi väljundkataloog on lähtekataloogi all olev alamkaust.
(2) Pakktöötluse moodul: kasutab taustatöötluseks mitme lõimega tehnoloogiat, vältides liidese külmumist ja kuvab samal ajal töötlemise edenemist reaalajas edenemisriba kaudu.
(3) Tulemuste kuvamise moodul: esitab iga faili töötlemistulemused tabelivormingus, sealhulgas algse lehekülgede arvu, töötlemistoimingu ja olekuteabe, eristades edukad ja ebaõnnestunud olekud värvide järgi.
PDF-kõvera teisendamise kontrollimise tööriist
01
Põhifunktsioonid ja otsustusloogika
Kõverate teisendamise kontrollimise tööriist keskendub kindlaksmääramisele, kas dokumendi tekst on teisendatud kõverateks. Selle põhiline otsustusloogika põhineb PDF-dokumendi fonditeabe analüüsimisel.
(1) Teksti olemasolu tuvastamine: määrab, kas dokument sisaldab redigeeritavat teksti, eraldades lehtedelt teksti.
(2) Fonditeabe analüüs: analüüsib dokumendi manustatud fontide loendit. Kui fonditeave on olemas, näitab see, et teksti ei ole kõverateks teisendatud.
(3) Üldised otsusereeglid: kui tekstisisu on olemas ja fonditeave puudub, näitab see, et tekst on teisendatud kõverateks (roheline märk); tekstisisu puudumisel pole teisendust vaja (roheline märk); kui on olemas tekstisisu ja fonditeave, ei ole teksti teisendatud kõverateks (punane märk), nagu on näidatud joonisel 2.
See tööriist on spetsiaalselt loodud režiimis „ainult kontrolli, ära teisenda”. Peamine põhjus seisneb selles, et operaatorite tagasiside kohaselt võib ametlikke pitsereid sisaldavate failide kõvera teisendamisel plommid või muu graafika kergesti kaduda, nii et tööriist säilitab ainult kontrollimise funktsiooni.

Joonis 2 PDF-kõvera kontrollimise tööriist
02
Peamised tehnilised rakenduspunktid
See tööriist kasutab liidese loomiseks ka Tkinerit, millel on kolm peamist tehnilist punkti.
(1) Fonditeabe eraldamine: hankige PyMuPDF-i tekstiploki analüüsi funktsiooni abil kõik fondinimed ja nende esinemissagedus dokumendis.
(2) Tulemuste visualiseerimine: kasutage puuvaateid kontrollitulemuste kuvamiseks, eristades intuitiivselt erinevaid olekuid värvide ja ikoonide abil.
(3) Olekustatistika funktsioon: arvutab automaatselt välja nõuetele vastavate dokumentide arvu, aidates operaatoritel üldist kontrolli olekut kiiresti mõista.
Väljakutsed ja lahendused arendusprotsessi käigus
Mitteprofessionaalse arendajana{0}} puutusin tööriistade arendamise käigus kokku paljude tehniliste väljakutsetega. Konkreetsed probleemid ja lahendused on järgmised.
(1) PDF-i sõelumise sügavuse probleem: esialgne PDF-teek ei suutnud fonditeavet täpselt ekstraktida, kuid pärast tehisintellekti soovitust lahendas probleem PyMu PDF-teegile ülemineku.
(2) Liidese viivituse probleem: suure hulga failide partiidena töötlemisel ei reageeri liides sageli. AI juhendamisel rakendati mitme lõimega töötlemislahendus, mis lahendas selle probleemi tõhusalt.
(3) Hiina moonutatud tekst: fondi parameetrite ja kodeerimisseadete konfigureerimisega lahendatakse liidestes ja eksporditud failides kuvatavate moonutatud hiina märkide probleem.
(4) Erandi käsitlemise mehhanism: rikutud PDF-failidest põhjustatud programmi krahhide probleemi lahendamiseks on erandi püüdmise mehhanismi täiustatud, et tagada, et ühe faili tõrge ei mõjuta kogu protsessi.
Kogu arendusprotsessi vältel mängisid tehisintellekti tööriistad tehniliste konsultantidena olulist rolli, pakkudes mitte ainult peamisi koodinäiteid, vaid selgitades ka PDF-failivormingu parsimise põhimõtteid, aidates arendajatel eriteadmisi kiiresti omandada.
Tööriistarakenduste väärtus ja väljavaade
Nende kahe tööriista rakendamine on toonud kaasa tootmistöö tõhususe olulise paranemise, mis kajastub konkreetselt kahes järgmises aspektis.
(1) Ajakulu kokkuhoid: käsitsi ülevaatused, mis varem kestsid 1 tund, saab nüüd läbida 5 minutiga, suurendades tõhusust peaaegu 10 korda.
(2) Parem kvaliteedistabiilsus: väldib tõhusalt käsitsi kontrollimisest tulenevaid möödalaskmisi, tagades ühtlase printimiskvaliteedi.
Nende kahe vidina arendusprotsessi dokumenteerimise eesmärk on anda edasi "uurimise ja innovatsiooni" tööfilosoofiat, keskendudes konkreetsete probleemide lahendamisele tegelikus tootmises, traditsiooniliste töövoogude optimeerimisele tehniliste vahendite abil ning lõppkokkuvõttes kulude vähendamise ja tõhususe parandamise saavutamisele.

