style="display:inline-block;width:728px;height:90px"
data-ad-client="ca-pub-5164839828746352"
data-ad-slot="7563230308">

implementación de StreamTokenizer

Buenas tardes, tengo que hacer un programa que lea las etiquetas de una archivo html, y guardar en un txt lo que hay dentro de las etiquetas, ya se como crear un archivo txt desde un programa por medio del metodo BufferedWriter, mi pregunta es como se implemente Stream Tokenizer y si lo que resulte si lo puedo guardar con el metodo BufferWriter, perdón pero soy principiante, llevo 20 días tratando de programar en Java

Opciones de visualización de comentarios

Seleccione la forma que prefiera para mostrar los comentarios y haga clic en «Guardar las opciones» para activar los cambios.
Imagen de Marce

StreamTokenizer te sirve para

StreamTokenizer te sirve para leer de un archivo o un flujo de entrada y convertir ese flujo en tokens tomando en cuenta caracteres válidos tales como: espacio en blanco, letras, números, comillas y comentarios estilo C o C++ dando como resultado algo así:

<title> Hola Mundo </title> = tokens[<title>,  ,Hola,  ,Mundo,  ,</title>]

Como ves aquí se está separando por cada byte leído según coincida con los caracteres válidos. A diferencia del StringTokenizer esta clase limita mucho la separación de tokes, con StringTokenizer podemos hacer más cosas como idicar que caracter es el que queremos que tome para hacer la separación de tokens. Lo que tu realmente necesitas es separar tokens que esten entre TAGs algo como:

<title> Hola Mundo </title> = tokens[Hola Mundo]

Aquí se obtiene un solo token que encontró al truncar palabras cada que encontraba un TAG.

Creo que StreamTokenizer no te servirá mucho a menos que quiras trabajar bastante; más bien necesitarias algo para xml aquí hay una lista de Apis para manejar archivos xml y poder leerlos sin problema.

De todos modos aquí te dejo la implementación del StreamTokenizer:

File file=new File(archivo); //Creamos Flujo de Entrada
if(file.exists()){//Si existe
    StreamTokenizer tokenizer=new StreamTokenizer(new FileReader(file)); //Asignamos el flujo de entrada al StreamTokenizer
    int token=tokenizer.nextToken(); //Obtener siguiente token
    while(token!=StreamTokenizer.TT_EOF){ //Si el token no es el fin del archivo
        switch (token){ //Se mete en un switch para saber el tipo de valor que trae el token
            case StreamTokenizer.TT_WORD:           System.out.println("Token: "+tokenizer.sval); //Si es palabra
            case StreamTokenizer.TT_NUMBER:       System.out.println("Token: "+tokenizer.nval); //Si es número
        }        
        token=tokenizer.nextToken(); //Se obtiene el siguiente token
    }
}

StreamTokenizer Api
StringTokenizer Api

Imagen de neko069

Coincido con @marce, puedes

Coincido con @marce, puedes checar los tutoriales de SAX y DOM aquí, te vas a ahorrar muchas horas de trabajo, tratando de construir algo que ya está hecho, además en otros post como éste y éste(busca el apartado de XML) hay ligas para que puedas checar otros APIS para lidiar con XML; todos muy digeribles...

StingTokenizer implementación ayuda!!!!!!!!!!!!!!

Tengo que hacer un programa, que me lea un archivo fuente, separe la etiquetas y las guarde en un txt,

tengo como abrir abrir el archivo con BufferedReader, y como hacerlo txt con BufferedWriter, pero no tengo la imprlementacion de StringTokenizer, me pueden ayudar porfa? gracias

style="display:inline-block;width:728px;height:90px"
data-ad-client="ca-pub-5164839828746352"
data-ad-slot="7563230308">