Had fight with maven. It decided to block HTTP repositories.
[meviz.git] / src / main / java / eu / svjatoslav / meviz / encoder / converters / Ocr.java
1 /*
2  * Meviz - Various tools collection to work with multimedia. Author: Svjatoslav Agejenko.
3  * This project is released under Creative Commons Zero (CC0) license.
4  */
5
6
7 package eu.svjatoslav.meviz.encoder.converters;
8
9 import eu.svjatoslav.meviz.encoder.EncodingOptions;
10
11 import java.io.File;
12 import java.util.List;
13
14 public class Ocr extends AbstractConverter {
15
16     @Override
17     public String getCommand(final File inputFile, final File targetFile,
18                              final EncodingOptions options, String targetFormat) {
19
20         // for some stupid reason tesseract ALWAYS insists on automatically
21         // adding txt suffix
22         String targetAbsolutePath = targetFile.getAbsolutePath();
23         String targetFileName = targetAbsolutePath.substring(0,
24                 targetAbsolutePath.length() - 4);
25
26         return "tesseract \"" + inputFile.getAbsolutePath() + "\" \""
27                 + targetFileName + "\"";
28     }
29
30     @Override
31     public List<String> getSourceFileExtensions() {
32         return toList("tif", "tiff", "png", "jpg", "jpeg");
33     }
34
35     @Override
36     public List<String> getTargetFileExtensions() {
37         return toList("txt");
38     }
39
40     @Override
41     public boolean isTerminalMandatory() {
42         return false;
43     }
44
45 }