Удалить расширение имени файла в Java
(Без включения каких-либо внешних библиотек.)
Какой самый эффективный способ удалить расширение имени файла в Java, не предполагая ничего из имени файла?
Некоторые примеры и ожидаемые результаты:
- папка> папка
- hello.txt > привет
- read.me> читать
- hello.bkp.txt > hello.bkp
- странно.. имя> странно.
- .hidden>.hidden
(или последний должен быть просто скрыт?)
Редактировать: исходный вопрос предполагал, что вход является именем файла (не путь к файлу). Поскольку некоторые ответы говорят о путях к файлам, такие функции также должны работать в таких случаях:
- rare.folder / hello> rare.folder / hello
Этот конкретный случай очень хорошо рассматривается ответом Сильвен М.
10 ответов
Я собираюсь нанести удар по этому, который использует двухаргументную версию lastIndexOf
чтобы удалить какой-то специальный код проверки и, надеюсь, сделать намерение более читабельным. Авторы благодарности Джастину Джингу Нельсону за основу этого метода:
public static String removeExtention(String filePath) {
// These first few lines the same as Justin's
File f = new File(filePath);
// if it's a directory, don't remove the extention
if (f.isDirectory()) return filePath;
String name = f.getName();
// Now we know it's a file - don't need to do any special hidden
// checking or contains() checking because of:
final int lastPeriodPos = name.lastIndexOf('.');
if (lastPeriodPos <= 0)
{
// No period after first character - return name as it was passed in
return filePath;
}
else
{
// Remove the last period and everything after it
File renamed = new File(f.getParent(), name.substring(0, lastPeriodPos));
return renamed.getPath();
}
}
Для меня это понятнее, чем скрытые файлы в специальном корпусе и файлы, которые не содержат точку. Это также читается яснее, чем я понимаю вашу спецификацию; что-то вроде "удалить последнюю точку и все, что следует за ней, предполагая, что она существует и не является первым символом имени файла".
Обратите внимание, что этот пример также подразумевает строки в качестве входов и выходов. Поскольку большая часть абстракции требует File
объектов, было бы немного яснее, если бы это были входы и выходы.
Использование общего ввода-вывода из Apache http://commons.apache.org/io/
public static String removeExtension (Строка имени файла)
К вашему сведению, исходный код здесь:
Арг, я только что попробовал что-то...
System.out.println(FilenameUtils.getExtension(".polop")); // polop
System.out.println(FilenameUtils.removeExtension(".polop")); // empty string
Таким образом, это решение кажется не очень хорошим... Даже с обычным io вам придется поиграть с removeExtension() getExtension() indexOfExtension()...
Это займет путь к файлу, а затем вернет новое имя файла без расширения.
public static String removeExtention(String filePath) {
File f = new File(filePath);
// if it's a directory, don't remove the extention
if (fisDirectory()) return f.getName();
String name = f.getName();
// if it is a hidden file
if (name.startsWith(".")) {
// if there is no extn, do not rmove one...
if (name.lastIndexOf('.') == name.indexOf('.')) return name;
}
// if there is no extention, don't do anything
if (!name.contains(".") return name;
// Otherwise, remove the last 'extension type thing'
return name.substring(0, name.lastIndexOf('.'))
}
Люди должны заметить, что это было написано на моем нетбуке, в крошечном окне редактора SO. Этот код не предназначен для производства. Он предназначен только для сервера как хороший пример первой попытки того, как бы я удалил расширение из имени файла.
На самом деле это очень просто, если у вас есть правильное имя файла.
В именах файлов Windows символ точки используется только для обозначения расширения. Так что убери точку и все, что после нее.
В unix-подобных именах файлов точка указывает расширение, если оно находится после последнего разделителя ('/') и имеет по крайней мере один символ между ним и последним разделителем (и не является первым символом, если разделителей нет). Найдите последнюю точку, посмотрите, удовлетворяет ли она условиям, и удалите ее и любые завершающие символы, если это так.
Важно, чтобы вы проверили имя файла перед тем, как сделать это, так как этот алгоритм для инвализованного имени файла может сделать что-то неожиданное и сгенерировать правильное имя файла. Поэтому в Windows вам может потребоваться проверить, что после точки нет обратной косой черты или двоеточия.
Если вы не знаете, с каким именем файла вы имеете дело, обработка всех их как Unix поможет вам в этом.
int p=name.lastIndexOf('.');
if (p>0)
name=name.substring(0,p);
Я сказал "p>0" вместо "p>=0", потому что, если первый символ - точка, мы, вероятно, не хотим стирать все имя целиком, как в вашем примере ".hidden".
Вы хотите на самом деле обновить имя файла на диске или вы просто манипулируете им внутри?
Используйте новый Remover(). Remove (String),
jdb@Vigor14:/tmp/stackru> javac Remover.java && java Remover
folder > folder
hello.txt > hello
read.me > read
hello.bkp.txt > hello.bkp
weird..name > weird.
.hidden > .hidden
Remover.java,
import java.util.*;
public class Remover {
public static void main(String [] args){
Map<String, String> tests = new LinkedHashMap<String, String>();
tests.put("folder", "folder");
tests.put("hello.txt", "hello");
tests.put("read.me", "read");
tests.put("hello.bkp.txt", "hello.bkp");
tests.put("weird..name", "weird.");
tests.put(".hidden", ".hidden");
Remover r = new Remover();
for(String in: tests.keySet()){
String actual = r.remove(in);
log(in+" > " +actual);
String expected = tests.get(in);
if(!expected.equals(actual)){
throw new RuntimeException();
}
}
}
private static void log(String s){
System.out.println(s);
}
public String remove(String in){
if(in == null) {
return null;
}
int p = in.lastIndexOf(".");
if(p <= 0){
return in;
}
return in.substring(0, p);
}
}
Я знаю регулярное выражение, чтобы сделать это, но в Java я должен написать как 10 строк кода, чтобы сделать простую замену регулярного выражения?
С и без уничтожения скрытых файлов:
^(.*)\..*$
^(..*)\..*$
Регулярное выражение для этих вещей достаточно "быстрое", но неэффективное по сравнению с самым простым из возможных способов: отсканируйте строку с конца и обрежьте ее до первой точки (не включительно). В Java вы могли бы использовать lastIndexOf и подстроку, чтобы взять только ту часть, которая вас интересует. Начальная точка должна рассматриваться как особый случай, и если последнее вхождение "." в начале, вся строка должна быть возвращена.
remove()
вышеприведенная функция должна быть переписана для поддержки тестовых случаев, таких как LOST.DIR/myfile.txt
public static String removeExtension( String in )
{
int p = in.lastIndexOf(".");
if ( p < 0 )
return in;
int d = in.lastIndexOf( File.separator );
if ( d < 0 && p == 0 )
return in;
if ( d >= 0 && d > p )
return in;
return in.substring( 0, p );
}