Saltar al contenido

Manipulación de datos de cadenas en R

Esto se utiliza para crear cadenas vacías porque no son fijas, podemos proporcionar valores más tarde.

<pre>123myquote = caracter(0)myquote <- $0027$0027myquote <- ""</pre>
r

Manipulación de datos de cadenas en R
Manipulación de datos de cadenas en R

Mostrar la longitud de la cuerda

La longitud de las cuerdas debe ser comprobada para varios propósitos como:-Comparar dos cuerdas- Encontrar la cuerda más larga o más corta

  • Aplicación del formato a las cuerdas

Revisemos la longitud(), nchar(), y str_length de stringr.

Longitud()

<pre>1<gt;longitud(mi cita)</pre>
r

Salida:

<pre>1`[1] 1`</pre>

Para la cadena anterior, como R almacena datos como vectores, la función de longitud devuelve "1" para elindex1 .

nchar()

<pre>1<gt;nchar(mi cita)</pre>
r

Salida:

<pre>1`[1] 136`</pre>

nchar cuenta el total de caracteres de la cadena.

str_length()

<pre>1> str_length(myquote)</pre>
r

Salida:

<pre>1`[1] 136`</pre>

str_length() devuelve el número de puntos de código en una cadena. Generalmente, un punto de código es un carácter, pero no siempre.

Combina dos cuerdas con c() y str_c()

A veces, necesitamos añadir una cadena a una cadena existente. Por ejemplo, la cita mencionada anteriormente en mi cadena de citas no contiene un nombre o identificador. Intentemos añadir esto como una cadena.

Añadir una cadena usando la función de combinación c()

<pre>1<gt;mi cita <-c(mi cita,"-John F. Kennedy";)</pre>
r

Salida:

La paz es un proceso diario, semanal y mensual, que cambia gradualmente las opiniones, erosiona lentamente las viejas barreras, construye silenciosamente nuevas estructuras..;

Esto almacena los datos como dos cadenas combinadas con recuentos de caracteres individuales.

Añadir una cadena usando la función de combinación str_c()

<pre>1> str_c(myquote,"-John F. Kennedy", sep="",collapse =NULL)</pre>
r

Salida:

La paz es un proceso diario, semanal y mensual, que cambia gradualmente las opiniones, erosiona lentamente las viejas barreras, construye silenciosamente nuevas estructuras -John F. Kennedy-. Puede usar el argumento sep para especificar cómo se separan las cuerdas. Dado que str_c() crea un vector, recicla automáticamente un vector más corto al tamaño del elemento más largo. ### Subconjunto de una cadena Para extraer partes de cadenas, puede utilizar el subconjunto() o el str_sub(). Esto es útil en casos como la fecha y la hora almacenadas juntas como una cadena y se necesita extraer sólo la parte de la fecha de los datos. Ambas funciones requieren que se extraiga el inicio y el final de la cadena. «`r>substr(myquote,17,45)</pre>

Salida:

<pre>1`[1] ", un proceso semanal, mensual" ""`</pre>
<pre>1> str_sub(myquote,start=17,end=45)</pre>
r

Salida:

<pre>1`[1] ", un proceso semanal, mensual"`</pre>

Dividir los elementos de una cadena en subcadenas basadas en coincidencias con un patrón determinado:

<pre>1> strsplit(mi cita,"lentamente")</pre>
r

Salida:

<pre>12`[1] "La paz es un proceso diario, semanal, mensual, que cambia gradualmente las opiniones, "[2] " erosionando viejas barreras, construyendo silenciosamente nuevas estructuras"`</pre>
<pre>1> str_split(myquote,"lentamente")</pre>
r

Salida:

<pre>12`[1] "La paz es un proceso diario, semanal, mensual, que cambia gradualmente las opiniones, "[2] " erosionando viejas barreras, construyendo silenciosamente nuevas estructuras" `</pre>

En este ejemplo, la cadena myquote se divide en un vector de dos caracteres donde se encuentra la palabra "lentamente".

Buscar y reemplazar funciones

Para encontrar una cadena, puedes usar las funciones grep, grepl(), regexpr(), gregexpr() y regexec(). Éstas difieren en el formato y los detalles de los resultados. Para realizar una sustitución de la primera coincidencia solamente, usa su

1; str_replace_all(myquote,"-"," ")

r

Salida: