How to create clouds with word chunks?

Ask specific questions about your target languages. Beginner questions welcome!
Kraut
Black Belt - 2nd Dan
Posts: 2599
Joined: Mon Aug 07, 2017 10:37 pm
Languages: German (N)
French (C)
English (C)
Spanish (A2)
Lithuanian
x 3204

How to create clouds with word chunks?

Postby Kraut » Fri May 19, 2023 1:47 pm

This is the beginning of a text that I have learnt by heart. To make single meaningful units, I have created - handwritten - chunks and put them into little clouds. But this is very painful business. Is there a simpler way of creating these "cloud-chunks" automatically or just distribute the following chunks randomly in a text?

Una tarde bajamos a la playa.
a la cual (a la que/a que) tiene acceso directo el camping.
Es una playa salvaje.
sin socorrista.
El único personal del camping es un hombre.
que se encuentra controlando.
el acceso al mismo.
El señor ( supuestamente llamado Marcelo).
nos dio unos tickets.
los cuales (que).
cuando regresas de la playa al camping.
tienes que entregarle.
para poder entrar.
You do not have the required permissions to view the files attached to this post.
1 x

User avatar
leosmith
Brown Belt
Posts: 1341
Joined: Thu Sep 29, 2016 10:06 pm
Location: Seattle
Languages: English (N)
Spanish (adv)
French (int)
German (int)
Japanese (int)
Korean (int)
Mandarin (int)
Portuguese (int)
Russian (int)
Swahili (int)
Tagalog (int)
Thai (int)
x 3104
Contact:

Re: How to create clouds with word chunks?

Postby leosmith » Sat May 20, 2023 2:57 am

No offense, but I don't understand what you are trying to accomplish here. At first I thought you were trying to memorize a longish text, but then I re-read your post. I don't get why you want to break it into "single meaningful units".
2 x
https://languagecrush.com/reading - try our free multi-language reading tool

Online
Doitsujin
Green Belt
Posts: 402
Joined: Sat Jul 18, 2015 6:21 pm
Languages: German (N)
x 801

Re: How to create clouds with word chunks?

Postby Doitsujin » Sat May 20, 2023 7:17 am

Kraut wrote:Is there a simpler way of creating these "cloud-chunks" automatically or just distribute the following chunks randomly in a text?
The technical term for these "word chunks" is n-grams or collocations. You can generate them with AntConc (freeware) and many other tools that you can find by googling generate n-grams/collocations.
3 x

Kraut
Black Belt - 2nd Dan
Posts: 2599
Joined: Mon Aug 07, 2017 10:37 pm
Languages: German (N)
French (C)
English (C)
Spanish (A2)
Lithuanian
x 3204

Re: How to create clouds with word chunks?

Postby Kraut » Sat May 20, 2023 11:04 am

leosmith wrote:No offense, but I don't understand what you are trying to accomplish here. At first I thought you were trying to memorize a longish text, but then I re-read your post. I don't get why you want to break it into "single meaningful units".


I know it must sound weird: I already know the text by heart, but "linearly". Here I am confronted with a chunk (a word collocation that corresponds to a piece of reality) and have to scan my memory to find back into the situation: the preceding and following sentences. This kind of recall has desired difficulty at its best.

I got the idea after doing some homework in my Spanish course with the vague title "Describe a scene on an airplane" and came up with this:


Estabamos sentados comfortablemente en nuestros asientos de avion con la idea de disfrutar de un vuelo agradable con vistas al mar, intermitentemente echandonos una pequena siesta o viendo un partido de fútbol o un nuevo blockbuster de Hollywood en la pantalla del avion. De repente, todas las miradas de los pasajeros se enfocaron en un hombre que se acercaba al avion, sin maleta ni mochilo, solo con un objeto en la mano derecha que no pude identificar. Agarrandose y con mucho esfuerzo subió por las escaleras, resbalando por los ultimos escalones para finalmente llegar a la puerta del avion. Para mi sorpresa y horror, el hombre de securidad lo dejó entrar en (al) avion y vimos que el objeto que llevaba era una botella de wiskey. Tartamuedeando algo incomprensible se dirijió al ultimo asiento libre, justo al lado de nuestro pasillo. Mientras „estudiamos“ las manchas en la camisa del borracho, con rastros evidentes de su ultima comida en el restaurante del aeropuerto, „disfrutamos“ del olor a sudor y alcohol que su presencia transportaba en el aire. Asi empezó la historia de un vuelo que se convertió en una verdadera pesadilla.


It's all puzzled together with little chunks memorized in other texts that I had learnt via bidirectional translation.
3 x

User avatar
smallwhite
Black Belt - 2nd Dan
Posts: 2386
Joined: Mon Jul 06, 2015 6:55 am
Location: Hong Kong
Languages: Native: Cantonese;
Good: English, French, Spanish, Italian;
Mediocre: Mandarin, German, Swedish, Dutch.
.
x 4876

Re: How to create clouds with word chunks?

Postby smallwhite » Sat May 20, 2023 5:19 pm

Would subtitle software for videos have functions you might find useful? I imagine they break script into screens similar to what you are doing.
2 x
Dialang or it didn't happen.

Kraut
Black Belt - 2nd Dan
Posts: 2599
Joined: Mon Aug 07, 2017 10:37 pm
Languages: German (N)
French (C)
English (C)
Spanish (A2)
Lithuanian
x 3204

Re: How to create clouds with word chunks?

Postby Kraut » Sun May 21, 2023 2:44 am

Ha, AI can do this. Here is my first attempt with YouChat:

The following Spanish text is coherent and linear. I want you to do the following. Divide the text up in meaningful chunks. By meaningful chunks I mean little semantic units, a bit like collocations. Then mix the chunks randomly and print them out in a list, each chunk in one line. Here is an example:

porque acompañábamos a nuestros niños
no encuentro ni adjetivo
que nos ubicó en el hotel
Ya vimos las malas opiniones
etc ........


"Pongo una estrella porque hay que poner algo, pero jamas he estado en un sitio tan nefasto, malísima comida, muy sucio, malos olores, servicio.... no encuentro ni adjetivo.
Nos alojamos en el hotel porque acompañábamos a nuestros niños a un torneo de fútbol, y el organizador del evento fue el que nos ubicó en el hotel.
Unos días antes, conocimos que este era el hotel asignado. Ya vimos las malas opiniones, pero alles in allem total como solo íbamos a dormir, nos daba un poco igual. Pero cuando llegamos..... madre mía, la cosa iba de mal en peor.
Los pasillos daba miedo pisar, era de moqueta, (podéis ver la foto, completamente mugrienta). La habitación era de tarima, aunque estaban tablas levantadas. El baño olía fatal, las puertas del baño no cerraban porque estaban hinchadas de la humedad, y sucio (ver foto). Las almohadas parecían de papel fumar. Las neveras ( los afortunados que tenían/afortunados los que tenian) era de traca porque estaban sucias, no se cuanto tiempo llevaban sin limpiar (ver foto que adjunto) y yo era privilegiado, la de un amigo tenía hasta moho."

Here are the meaningful chunks of the Spanish text:

"Pongo una estrella porque hay que poner algo, pero jamás he estado en un sitio tan nefasto"

"malísima comida, muy sucio, malos olores, servicio.... no encuentro ni adjetivo."

"Nos alojamos en el hotel porque acompañábamos a nuestros niños a un torneo de fútbol, y el organizador del evento fue el que nos ubicó en el hotel."

"Unos días antes, conocimos que este era el hotel asignado."

"Ya vimos las malas opiniones, pero alles in allem total como solo íbamos a dormir, nos daba un poco igual."

"Pero cuando llegamos..... madre mía, la cosa iba de mal en peor."

"Los pasillos daba miedo pisar, era de moqueta, (podéis ver la foto, completamente mugrienta)."

"La habitación era de tarima, aunque estaban tablas levantadas."

"El baño olía fatal, las puertas del baño no cerraban porque estaban hinchadas de la humedad, y sucio (ver foto)."

"Las almohadas parecían de papel fumar."

"Las neveras ( los afortunados que tenían/afortunados los que tenian) era de traca porque estaban sucias, no se cuanto tiempo llevaban sin limpiar (ver foto que adjunto) y yo era privilegiado, la de un amigo tenía hasta moho."

Here is the mixed up list of chunks:

"Los pasillos daba miedo pisar, era de moqueta, (podéis ver la foto, completamente mugrienta)."

"Nos alojamos en el hotel porque acompañábamos a nuestros niños a un torneo de fútbol, y el organizador del evento fue el que nos ubicó en el hotel."

"Las almohadas parecían de papel fumar."

"El baño olía fatal, las puertas del baño no cerraban porque estaban hinchadas de la humedad, y sucio (ver foto)."

"Unos días antes, conocimos que este era el hotel asignado."

"Ya v

Can you break them up in even smaller parts? Example: 1 Los pasillo daba miedo pisar 6. el El baño olía fatal 9. Nos alojamos en el hotel etc Now do it again


Sure, here are the even smaller parts:

"Los pasillos daba miedo pisar"

"Era de moqueta"

"(podéis ver la foto, completamente mugrienta)"

"El baño olía fatal"

"Las puertas del baño no cerraban porque estaban hinchadas de la humedad"

"Sucio (ver foto)"

"Nos alojamos en el hotel"

"Porque acompañábamos a nuestros niños a un torneo de fútbol"

"El organizador del evento fue el que nos ubicó en el hotel"

"Unos días antes, conocimos que este era el hotel asignado"

"Ya vimos las malas opiniones"

"Pero alles in allem total como solo íbamos a dormir, nos daba un poco igual"

"Pero cuando llegamos..... madre mía, la cosa iba de mal en peor"

"La habitación era de tarima"

"Aunque estaban tablas levantadas"

"Las almohadas parecían de papel fumar"

"Las neveras"

"(los afortunados que tenían/afortunados los que tenian) era de traca porque estaban sucias"

"No se cuanto tiempo llevaban sin limpiar (ver foto que adjunto)"

"Y yo era privilegiado, la de un amigo tenía hasta moho"

Let me know if you need anything else.


Even simpler would be separating the chunks with points and commas and have the bot mix them and print them out. I think a version 4 bot can do this flawlessly.
1 x

Cainntear
Black Belt - 3rd Dan
Posts: 3469
Joined: Thu Jul 30, 2015 11:04 am
Location: Scotland
Languages: English(N)
Advanced: French,Spanish, Scottish Gaelic
Intermediate: Italian, Catalan, Corsican
Basic: Welsh
Dabbling: Polish, Russian etc
x 8663
Contact:

Re: How to create clouds with word chunks?

Postby Cainntear » Sun May 21, 2023 12:12 pm

Still not sure what you're aiming for. Are you expecting formatted output? Turning the chunks into random flashcards? Something else?
3 x

Kraut
Black Belt - 2nd Dan
Posts: 2599
Joined: Mon Aug 07, 2017 10:37 pm
Languages: German (N)
French (C)
English (C)
Spanish (A2)
Lithuanian
x 3204

Re: How to create clouds with word chunks?

Postby Kraut » Mon May 22, 2023 10:37 am

The magic word is "text line shuffler." Here we go:


https://testsigma.com/free-tools/shuffle-text-lines

another one:
https://www.browserling.com/tools/random-lines

Pongo una estrella,
porque hay que poner algo,
pero jamas he estado,
en un sitio tan nefasto,
malísima comida muy sucio malos olores servicio.
no encuentro ni adjetivo.

Nos alojamos en el hotel,
porque acompañábamos a nuestros niños,
a un torneo de fútbol,
y el organizador del evento fue el,
que nos ubicó en el hotel.
Unos días antes,
conocimos,
que este era el hotel asignado.
Ya vimos las malas opiniones,
pero total,
como solo íbamos a dormir,
nos daba un poco igual.
Pero cuando llegamos.
madre mía,
la cosa iba de mal en peor.


shuffled

la cosa iba de mal en peor.
malísima comida, muy sucio, malos olores servicio.
nos daba un poco igual.
conocimos,
a un torneo de fútbol,
pero total,
Pero cuando llegamos.
Ya vimos las malas opiniones,
como solo íbamos a dormir,
Pongo una estrella,
pero jamas he estado,

y el organizador del evento fue el,
porque hay que poner algo,
Unos días antes,
en un sitio tan nefasto,
que este era el hotel asignado.
que nos ubicó en el hotel.
no encuentro ni adjetivo.
madre mía,
Nos alojamos en el hotel,
porque acompañábamos a nuestros niños,


Why do I do this? I have memorized the complete text before and want to maintain it. I have realized that parts of the text, words, phrases etc don't pop up in new situations when they should, no transfer. By this kind of recall, isolating already learnt elements, putting them back in their context, visually!, I put stress on the brain (desirable difficulty) and thus hope to learn and memorize "deeper". Mother tongue and translation which were present during an earlier phase (bidirectional translation) are gone at this level.
Last edited by Kraut on Fri Sep 22, 2023 9:34 am, edited 2 times in total.
3 x

Kraut
Black Belt - 2nd Dan
Posts: 2599
Joined: Mon Aug 07, 2017 10:37 pm
Languages: German (N)
French (C)
English (C)
Spanish (A2)
Lithuanian
x 3204

Re: How to create clouds with word chunks?

Postby Kraut » Wed May 24, 2023 7:24 pm

This is the best I have found which comes close to what I'm looking for.

Puedo llegar a decir
que el recepcionista que nos atendió
cuando dimos las quejas
a lo largo de la noche
tenía una actitud pasota
y algo chulesca.


https://monkeylearn.com/word-cloud/

Although it looks as if the software could do complete genuine chunks or phrases, it doesn't and admits there will be elements missing.
You do not have the required permissions to view the files attached to this post.
1 x


Return to “Practical Questions and Advice”

Who is online

Users browsing this forum: Doitsujin and 2 guests